北京发布“悟界”系列多模态大模型

腾赚网 2025年06月06日 17:03 175 0

北京智源人工智能研究院在2025北京智源大会上发布了“悟界”系列大模型。这一系列包括全球首个原生多模态世界模型“悟界•Emu3”、脑科学多模态通用基础模型“悟界•见微Brainμ”等。其中，Emu3于2024年10月发布，通过新型视觉tokenizer技术，将图像和视频转化为离散符号序列，实现文本、图像、视频的跨模态理解和生成。这种自回归框架为多模态交互提供了强大支持。

世界模型是让AI像人类一样认知世界的工具，它能让机器学习算法构建起关于物理世界的虚拟模型。基于此，AI可实现更自然的交互，如智能客服中的多模态分析或智能教育中的个性化教学。目前，造车新势力在应用端对世界模型布局积极，特别是在智驾领域，企业竞争已从车端算力转向云端世界模型能力。不过，其规模化落地仍面临算力成本和数据质量的挑战。

本文地址： https://www.tengzhuan.com/post/747616.html

文章来源：腾赚网