文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
谷歌最近连放大招,Gemini 3 Pro和Nano Banana Pro接连亮相,迅速点燃全球AI圈。两款模型均出自DeepMind之手,眼下热度未消,团队已悄然转向下一个目标——世界模型。公司掌门人哈萨比斯直言,这是通往通用人工智能(AGI)的关键拼图。他提到的SIMA 2和Genie系列,正是基于Gemini打造的智能体与动态环境生成系统,能在720p下实时构建可交互的3D世界,记忆连贯长达一分钟。这些技术不仅可用于游戏,更为机器人和自动驾驶提供高仿真训练场。
这股“世界模型”浪潮正席卷硅谷。Meta前首席科学家杨立昆宣布年底离职创业,专注物理世界建模;李飞飞的WorldLabs推出Marble,能从单张图片生成持久3D空间;英伟达也早早布局,推出Cosmos平台支持合成数据生成。背后争论的核心清晰而深刻:AI应靠文字“读懂”世界,还是靠视觉与感知“看懂”现实?前者信奉数据堆叠催生智能,后者坚持理解物理规律才是真突破。尽管目前世界模型尚无ChatGPT级爆款,落地节奏缓慢,质疑声不断,但其技术门槛之高、潜力之深,仍让顶尖玩家纷纷押注未来。
抱歉,评论功能暂时关闭!