文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
北京智源人工智能研究院在2025北京智源大会上发布了“悟界”系列大模型。这一系列包括全球首个原生多模态世界模型“悟界•Emu3”、脑科学多模态通用基础模型“悟界•见微Brainμ”等。其中,Emu3于2024年10月发布,通过新型视觉tokenizer技术,将图像和视频转化为离散符号序列,实现文本、图像、视频的跨模态理解和生成。这种自回归框架为多模态交互提供了强大支持。
世界模型是让AI像人类一样认知世界的工具,它能让机器学习算法构建起关于物理世界的虚拟模型。基于此,AI可实现更自然的交互,如智能客服中的多模态分析或智能教育中的个性化教学。目前,造车新势力在应用端对世界模型布局积极,特别是在智驾领域,企业竞争已从车端算力转向云端世界模型能力。不过,其规模化落地仍面临算力成本和数据质量的挑战。
抱歉,评论功能暂时关闭!