谷歌加速布局“世界模型”

腾赚网 91 0

谷歌最近连放大招,Gemini 3 Pro和Nano Banana Pro接连亮相,迅速点燃AI圈。两款模型均出自DeepMind之手,眼下热度未散,团队已悄然转向更前沿的方向——“世界模型”。公司掌门人哈萨比斯明确表示,这是通往通用人工智能(AGI)的关键拼图。他口中念叨的SIMA 2、Genie等项目,正是基于Gemini构建的3D智能体或动态环境,不仅能实时生成可探索的虚拟空间,还能维持长达一分钟的场景连贯性,为机器人、自动驾驶提供训练温床。

这股风潮早已不止于谷歌。Meta的杨立昆宣布年底离职创业,专注打造能理解物理世界的世界模型;李飞飞的WorldLabs推出Marble,用一张图或一句话就能构建持久3D空间;英伟达也早布局Cosmos平台,助力合成数据生成。技术路线之争随之浮现:一边是靠文本“读懂”世界的语言模型派,另一边是让AI真正“看懂”并推理现实的视觉智能派。尽管目前世界模型尚无ChatGPT级别的爆款产品,落地节奏较慢,但其对物理规律的理解潜力,决定了这场长跑才刚刚起步。

抱歉,评论功能暂时关闭!