本期《好好聊》节目邀请了清华大学智能产业研究院的赵昊老师,探讨具身智能领域的突破性进展。赵昊老师分享了他对技术发展的看法,强调了物理世界建模和大规模学习的重要性。他认为 VLA 本质上是深度学习的应用,并回顾了深度学习在计算机视觉、语音识别和机器人领域的历史。赵昊老师还深入分析了 ImageNet 的意义、SIFT 特征、神经网络的发展以及数据和硬件对深度学习的推动作用。此外,他还谈到了计算机视觉界的研究范式、具身智能的概念以及世界模型的构建,并对 OpenAI、李岳飞和 Yann LeCun 等人的不同世界模型方法进行了比较。最后,赵昊老师还讨论了模拟器在 AI 发展中的作用以及英伟达在 AI 人才竞争中的地位。
Sign in to continue reading, translating and more.
Continue