文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
Anthropic凌晨悄然上线Claude Sonnet 4.6,号称“史上最强Sonnet”。它在编程、计算机操作、长文本推理和智能体规划等关键任务上实现跃升,多项基准测试成绩直逼旗舰模型Opus 4.6——金融分析、办公任务两项测评中,Sonnet 4.6得分双双反超;SWE-bench软件工程测试也紧咬Opus。100万token上下文窗口依旧保留,能一口气吃下整部《三体》或数百页论文,还能真正“通盘思考”。
这代Sonnet更懂干活:OSWorld计算机操作得分从一年前的28飙升至72.5,填表、切标签、调用多工具协同已接近人类水平。开发者实测单次调用就重构整个代码库,新增3000行代码、新建12个文件;Box和Hebbia等企业反馈深度推理与答案匹配率显著提升。定价维持原样,输入3美元\/百万token、输出15美元,却成了免费和Pro用户的默认模型。AWS火速上架,称其为“最强计算机使用模型”。低价高能的组合拳,正加速AI扎进真实工作流,也让SaaS行业的未来悄悄绷紧了弦。
抱歉,评论功能暂时关闭!