文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
谷歌最近连放大招,Gemini 3 Pro和Nano Banana Pro接连亮相,迅速点燃AI圈。两款模型均出自DeepMind之手,眼下热度未散,团队已悄然转向更前沿的方向——“世界模型”。公司掌门人哈萨比斯明确表示,这是通往通用人工智能(AGI)的关键拼图。他口中念叨的SIMA 2、Genie等项目,正是基于Gemini构建的3D智能体或动态环境,不仅能实时生成可探索的虚拟空间,还能维持长达一分钟的场景连贯性,为机器人、自动驾驶提供训练温床。
这股风潮早已不止于谷歌。Meta的杨立昆宣布年底离职创业,专注打造能理解物理世界的世界模型;李飞飞的WorldLabs推出Marble,用一张图或一句话就能构建持久3D空间;英伟达也早布局Cosmos平台,助力合成数据生成。技术路线之争随之浮现:一边是靠文本“读懂”世界的语言模型派,另一边是让AI真正“看懂”并推理现实的视觉智能派。尽管目前世界模型尚无ChatGPT级别的爆款产品,落地节奏较慢,但其对物理规律的理解潜力,决定了这场长跑才刚刚起步。
抱歉,评论功能暂时关闭!