字节跳动推出多模态大模型Seed1.5-VL性能强劲

腾赚网 17 0

字节跳动Seed团队推出视觉-语言多模态大模型Seed1.5-VL,预训练数据超3Ttokens,具备强大的多模态理解和推理能力。其性能媲美谷歌Gemini 2.5 Pro,在60个评测基准中拿下38项最优成绩。Seed1.5-VL在视觉任务上表现出色,尤其在GUI代理任务中有亮眼表现。同时,模型优化了架构设计,降低了推理成本,适合交互式应用,能完成复杂任务如信息收集和游戏操作。

字节跳动推出多模态大模型Seed1.5-VL性能强劲-第1张图片-腾赚网

尽管优势明显,Seed1.5-VL仍存在局限性。在细粒度视觉感知和高层次推理任务中表现不稳定,视频推理能力也有待提升。目前该模型已在火山引擎开放API体验。多模态技术成为大厂竞争焦点,谷歌、OpenAI相继发布新模型,国内厂商也加速布局。券商看好AI主题投资,认为Agent能力的提升将带动算力需求增长,建议关注相关领域机会。

抱歉,评论功能暂时关闭!