阿里千问登顶空间智能榜单前二

腾赚网 3 0

11月26日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。其中,Qwen3-VL-235B以13.5分的成绩高居榜首,Qwen2.5-VL-72B紧随其后获得12.9分,展现出在复杂空间任务中的卓越理解与推理能力。

SpatialBench作为近年来备受关注的第三方评测基准,专注于评估多模态大模型在空间结构、路径规划、三维感知等场景下的综合表现。此次阿里千问系列模型的领先成绩,不仅刷新了该榜单的历史纪录,也标志着国产大模型在高阶视觉理解领域已具备国际竞争力。

相较于国际主流模型如Gemini 3(9.6分)和GPT-5.1(7.5分),Qwen3-VL和Qwen2.5-VL在多项空间推理子任务中均表现出显著优势,进一步拉近了人工智能系统与人类基线之间的差距。这一突破为未来智能机器人、自动驾驶及AR/VR等依赖空间认知的应用场景提供了坚实的技术支撑。

抱歉,评论功能暂时关闭!