字节跳动推出多模态大模型Seed1.5-VL性能强劲

腾赚网 2025年05月13日 17:00 78 0

字节跳动Seed团队推出视觉-语言多模态大模型Seed1.5-VL，预训练数据超3Ttokens，具备强大的多模态理解和推理能力。其性能媲美谷歌Gemini 2.5 Pro，在60个评测基准中拿下38项最优成绩。Seed1.5-VL在视觉任务上表现出色，尤其在GUI代理任务中有亮眼表现。同时，模型优化了架构设计，降低了推理成本，适合交互式应用，能完成复杂任务如信息收集和游戏操作。

字节跳动推出多模态大模型Seed1.5-VL性能强劲-第1张图片-腾赚网

尽管优势明显，Seed1.5-VL仍存在局限性。在细粒度视觉感知和高层次推理任务中表现不稳定，视频推理能力也有待提升。目前该模型已在火山引擎开放API体验。多模态技术成为大厂竞争焦点，谷歌、OpenAI相继发布新模型，国内厂商也加速布局。券商看好AI主题投资，认为Agent能力的提升将带动算力需求增长，建议关注相关领域机会。

本文地址： https://www.tengzhuan.com/post/744686.html

文章来源：腾赚网