机器人研究科学家齐浩之探讨了具身智能领域中数据获取的挑战与技术路径。当前机器人训练面临遥操作数据质量高但采集难、视频数据量大但物理真实性不足的矛盾。业界正通过遥操作、视频学习及仿真模拟构建数据金字塔,其中遥操作虽处于塔尖且效果最精准,但视频学习被视为具备超越潜力的长远方向。针对 Google DeepMind 推出的 Genie3 等世界模型,尽管其在预测物理世界方面有所进展,但受限于视频生成模型尚未完全解决物理规律的真实性问题,且面临类似语言模型的 “幻觉” 挑战,利用基础模型实现机器人能力的突破仍处于研究阶段,距离真正掌握物理世界规律依然任重道远。
Outlines
Sign in to continue reading, translating and more.
Open full episode in Podwise