文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
11月26日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。其中,Qwen3-VL-235B以13.5分的成绩高居榜首,Qwen2.5-VL-72B紧随其后获得12.9分,展现出在复杂空间任务中的卓越理解与推理能力。
SpatialBench作为近年来备受关注的第三方评测基准,专注于评估多模态大模型在空间结构、路径规划、三维感知等场景下的综合表现。此次阿里千问系列模型的领先成绩,不仅刷新了该榜单的历史纪录,也标志着国产大模型在高阶视觉理解领域已具备国际竞争力。
相较于国际主流模型如Gemini 3(9.6分)和GPT-5.1(7.5分),Qwen3-VL和Qwen2.5-VL在多项空间推理子任务中均表现出显著优势,进一步拉近了人工智能系统与人类基线之间的差距。这一突破为未来智能机器人、自动驾驶及AR/VR等依赖空间认知的应用场景提供了坚实的技术支撑。
抱歉,评论功能暂时关闭!