小米开源47亿参数机器人VLA大模型

腾赚网 91 0

让理财更简单:万0.86超低手续费>>【>>戳我进入<<】

2月12日,小米开源首代机器人VLA大模型Xiaomi-Robotics-0。该模型参数达47亿,兼顾视觉语言理解与实时动作执行,在仿真测试和真实双臂机器人上均刷新多项SOTA纪录。它能在消费级显卡上流畅运行,叠毛巾、拆积木等复杂任务一气呵成。

小米开源47亿参数机器人VLA大模型-第1张图片-腾赚网

模型采用“大脑+小脑”混合架构:多模态VLM负责听懂指令、识别场景;Diffusion Transformer小脑生成平滑动作块。为解决真机卡顿,团队首创异步推理模式,配合Clean Action Prefix和Λ-shape注意力掩码,让机器人反应更快、动作更稳、遇变不慌。

抱歉,评论功能暂时关闭!