YouTube31 Mar 2026
2h 36m

Xie Chen : Data Survey — History, Landscape, Pyramid Structure, and Recipes for AI and Robotics Data

Podcast cover

Zhang Xiaojun Podcast

數據、算力與算法是人工智能的三駕馬車,其中數據對於機器人(Robotics)產業而言仍處於荒漠階段。光輪智能創始人兼 CEO 謝晨指出,機器人數據的獲取與處理比大語言模型更具結構性難度,核心瓶頸在於缺乏大規模、高質量的預訓練數據及有效的評測體系。機器人數據金字塔由真實本體數據、仿真數據及人類第一視角數據構成,其中仿真不僅是加速器,更是實現規模化評測與數據閉環的必備基建。數據產業正從靜態標註演進為以評測驅動的學習引擎,未來通用智能的實現將依賴於跨本體、具備泛化能力的數據系統,而非單純堆砌數據量,這要求數據商與大模型廠商深度共生,共同構建能讓 AI 進行自我迭代的物理與數字環境。

Outlines

Part 1: 創業背景、職涯轉折

Part 2: 數據演進、具身智能現狀

Part 3: 技術核心、數據引擎機制

Part 4: 未來展望、產業終局

Sign in to continue reading, translating and more.

Open full episode in Podwise