2026年5月,具身智能(Embodied AI)迎来”世界模型”爆发。普渡机器人发布PuduFM 1.0,实现从”简单执行”向”物理认知”的跨越;优必选Thinker-WM在Libero评测基准登顶;小米、英伟达、Physical Intelligence密集发布VLA模型。2026年具身智能横评来了。
普渡PuduFM 1.0:物理认知跨越,三大核心技术维度
普渡机器人于2026年5月11日正式发布具身智能大模型Pudu Foundation Model(PuduFM 1.0),实现了从”简单执行”向”物理认知”的跨越。
核心功能:
1. 三维空间深度感知与推理:可以理解三维空间的物理结构,进行空间推理。
2. 物理状态预测:可以预测未来的物理状态(如”物体掉落轨迹”),提前规划。
3. 真实交互持续进化:在真实交互中持续学习,不断进化。
4. 异构机器统一运行:支持不同形态的机器人统一运行,跨本体泛化。
适用场景:
– 商用服务机器人:餐厅送餐、酒店服务、商场导购,PuduFM可以理解环境并规划路径。
– 工业制造机器人:装配、搬运、质检,PuduFM可以理解物理状态并预测。
– 异构机器人协同:不同形态的机器人可以统一运行,跨本体泛化。
定价:企业定制,按机器人数量授权。
优必选Thinker-WM:Libero评测登顶,长程任务规划
优必选科技于2026年5月5日发布具身智能世界模型Thinker-WM,在权威具身智能评测基准Libero中登顶榜首,同时参与榜单排名的还有英伟达、Physical Intelligence、小米等知名公司的模型。
核心功能:
1. Libero评测登顶:在空间泛化、长程任务和综合性能上表现优异,登顶榜首。
2. Diffusion Transformer架构:统一多模态空间架构,实现视频表征与机器人动作空间的协同优化。
3. 智能想象推演:对未来场景进行智能想象推演,渐进式打磨动作生成的合理性与连贯性。
4. 长程任务规划:擅长复杂长程任务规划与执行,如”做饭、打扫房间、整理物品”。
适用场景:
– 家庭服务机器人:做饭、打扫、整理,Thinker-WM擅长长程任务规划。
– 复杂任务执行:需要多步骤、长时间规划的任务,Thinker-WM表现优异。
– 空间泛化:在新环境中快速适应,无需重新训练。
定价:企业定制,按机器人数量授权。
小米Xiaomi-Robotics-0:VLA路线,端到端决策
小米于2026年2月开源具身智能模型Xiaomi-Robotics-0,采用VLA(Vision-Language-Action)路线,47亿参数,支持视觉语言理解与实时执行。
核心功能:
1. VLA端到端决策:视觉输入→语言理解→动作输出,端到端决策。
2. 47亿参数:模型规模适中,可以在边缘设备运行。
3. 实时执行:支持实时执行,延迟<100ms。
4. 开源免费:完全开源,可以自由使用、修改、分发。
适用场景:
– 研究开发:开源免费,适合学术研究和技术开发。
– 边缘设备运行:47亿参数,可以在边缘设备运行。
– 实时执行需求:延迟<100ms,适合实时控制场景。
定价:完全免费(开源)。
2026年具身智能选型指南
| 维度 | 普渡PuduFM 1.0 | 优必选Thinker-WM | 小米Robotics-0 |
|---|---|---|---|
| 核心优势 | 物理认知跨越+异构泛化 | Libero登顶+长程任务 | VLA端到端+开源免费 |
| 技术路线 | 世界模型+分层解耦 | Diffusion Transformer | VLA端到端 |
| 参数规模 | 未公开 | 未公开 | 47亿 |
| 开源 | ❌ | ❌ | ✅ |
| 适用场景 | 商用服务+工业制造 | 家庭服务+长程任务 | 研究开发+边缘设备 |
| 定价 | 企业定制 | 企业定制 | 免费 |
选型建议:
– 如果你需要商用服务+工业制造:选普渡PuduFM 1.0(物理认知跨越+异构泛化)。
– 如果你需要家庭服务+长程任务:选优必选Thinker-WM(Libero登顶+长程任务规划)。
– 如果你需要研究开发+边缘设备:选小米Robotics-0(VLA端到端+开源免费)。
具身智能未来趋势(2026下半年)
趋势1:世界模型成为标配
2026年下半年,所有主流具身智能模型(普渡、优必选、小米、英伟达)都将支持”世界模型”,可以预测未来的物理状态,提前规划。
趋势2:Human Data范式转移
2026年下半年,具身智能训练将从”真机遥操作”转向”人类自然操作数据”(Human Data),数据采集成本数量级下降,模型能力上限突破。
趋势3:异构机器人统一运行
2026年下半年,具身智能模型将支持”异构机器人统一运行”(如”人形机器人、四足机器人、机械臂”共用一个模型),跨本体泛化。
趋势4:具身智能走进工厂
2026年下半年,具身智能将从”Demo秀”走向”工业生产一线”,人形机器人将正式扎根真实工厂,开启产业智能化升级。
2026年的具身智能市场,正在回答一个核心问题:当普渡PuduFM 1.0实现物理认知跨越,当优必选Thinker-WM在Libero登顶,当小米Robotics-0开源免费——具身智能终于从”Demo秀”变成”生产力工具”。未来2年,谁能同时做好”世界模型、长程任务规划、异构泛化、实时执行”四件事,谁就能在具身智能市场胜出。