北京发布“悟界”系列多模态大模型

腾赚网 115 0

北京智源人工智能研究院在2025北京智源大会上发布了“悟界”系列大模型。这一系列包括全球首个原生多模态世界模型“悟界•Emu3”、脑科学多模态通用基础模型“悟界•见微Brainμ”等。其中,Emu3于2024年10月发布,通过新型视觉tokenizer技术,将图像和视频转化为离散符号序列,实现文本、图像、视频的跨模态理解和生成。这种自回归框架为多模态交互提供了强大支持。

世界模型是让AI像人类一样认知世界的工具,它能让机器学习算法构建起关于物理世界的虚拟模型。基于此,AI可实现更自然的交互,如智能客服中的多模态分析或智能教育中的个性化教学。目前,造车新势力在应用端对世界模型布局积极,特别是在智驾领域,企业竞争已从车端算力转向云端世界模型能力。不过,其规模化落地仍面临算力成本和数据质量的挑战。

抱歉,评论功能暂时关闭!