Claude Sonnet 4.6上线,性能直逼Opus

腾赚网 99 0

让理财更简单:万0.86超低手续费>>【>>戳我进入<<】

Anthropic凌晨悄然上线Claude Sonnet 4.6,号称“史上最强Sonnet”。它在编程、计算机操作、长文本推理和智能体规划等关键任务上实现跃升,多项基准测试成绩直逼旗舰模型Opus 4.6——金融分析、办公任务两项测评中,Sonnet 4.6得分双双反超;SWE-bench软件工程测试也紧咬Opus。100万token上下文窗口依旧保留,能一口气吃下整部《三体》或数百页论文,还能真正“通盘思考”。

这代Sonnet更懂干活:OSWorld计算机操作得分从一年前的28飙升至72.5,填表、切标签、调用多工具协同已接近人类水平。开发者实测单次调用就重构整个代码库,新增3000行代码、新建12个文件;Box和Hebbia等企业反馈深度推理与答案匹配率显著提升。定价维持原样,输入3美元\/百万token、输出15美元,却成了免费和Pro用户的默认模型。AWS火速上架,称其为“最强计算机使用模型”。低价高能的组合拳,正加速AI扎进真实工作流,也让SaaS行业的未来悄悄绷紧了弦。

抱歉,评论功能暂时关闭!