英伟达发布开源机器人视觉推理模型Cosmos Reason

腾赚网 148 0

在刚刚开幕的全球顶级图形技术会议SIGGRAPH上,英伟达一口气推出多款面向机器人开发的世界模型与工具,引发广泛关注。其中最亮眼的是一款参数量仅为70亿的开源AI模型Cosmos Reason,它具备视觉推理能力,能让机器人像人类一样理解环境、做出判断并执行任务。例如在实验中,机器人通过该模型识别出“面包和烤面包机”的场景后,能自主推理出下一步应把面包放进烤面包机,并转化为机械臂操作指令。

英伟达发布开源机器人视觉推理模型Cosmos Reason-第1张图片-腾赚网

英伟达表示,Cosmos Reason不仅能用于机器人“大脑”做规划与决策,还可广泛应用于自动整理训练数据、视频内容分析等多个AI场景。目前该模型已在实际业务中落地,包括公司内部的自动驾驶和机器人团队、优步、麦格纳国际等企业均在使用,涵盖配送、交通监控、视觉检测等领域。此外,英伟达还发布了Cosmos系列的多个新版本及Omniverse开发工具更新,进一步强化其在机器人与AI应用上的布局。

抱歉,评论功能暂时关闭!