Episode cover
27 May 2026
55m

Spark AI 李智昊:用视频做世界模型,路线非常不本质

Podcast cover

AI炼金术

世界模型的发展核心在于表征方式的突破,而非单纯依赖算力堆叠。当前主流的视频生成路径将 4D 物理世界压缩为有损的视频投影,导致物理规律丢失且计算冗余,难以支撑智能探索。通过将 4D 点云作为表征载体,并对运动残差进行高效压缩,能够建立更符合物理本质的智能模型。Spark 3D 开发者李智昊指出,表征层是智能的底层暗线,创业公司应抓住大厂在现有架构惯性下的空窗期,通过重构表征范式来打破性能天花板。这种从 4D 空间建模出发的路径,不仅能提升游戏资产生成精度,更为通向物理智能(Physical Intelligence)提供了更具扩展性的技术基石。

Outlines

Sign in to continue reading, translating and more.

Open full episode in Podwise