Claude Sonnet 4.6发布,性能反超Opus

腾赚网 103 0

让理财更简单:万0.86超低手续费>>【>>戳我进入<<】

Anthropic凌晨突然发布Claude Sonnet 4.6,号称“史上最强Sonnet”。它在编程、计算机操作、长文本推理和智能体规划等任务上大幅跃升,多项测试成绩反超刚发布的旗舰模型Opus 4.6——金融分析、办公任务两项得分更高,SWE-bench软件工程测试也逼近Opus水准。100万token上下文窗口让它能一口气“读完”整部《三体》或数百页论文,还能真正理解并调用其中信息。OSWorld计算机操作测试分数从一年前的28.0飙到72.5,填表、跨标签协作、处理复杂表格已接近人类水平。

这代Sonnet不只快,更聪明、更稳。开发者用它一次调用就重构整个代码库,新增3000行代码、新建12个文件;Box和Hebbia等企业证实其深度推理与任务执行能力明显增强。它甚至能在商业模拟中自主制定“先投入、后盈利”的策略,跑赢对手。价格却纹丝不动:百万token输入3美元、输出15美元,免费和Pro用户已默认切换至此模型。AWS火速上架,称其为“最强计算机使用模型”。低成本+高性能正加速AI落地真实工作流,也让市场开始担心:SaaS的生意,还能做多久?

抱歉,评论功能暂时关闭!