28 Mar 2024

E145|对话Meta田渊栋：被Transformer改变的世界与人类AGI的野心

硅谷101|中国版

本期播客节目介绍了神经网络研究员的学术历程和对神经网络工作原理的理解。讨论了神经网络在围棋、自动驾驶和AGI领域的应用，并探讨了达到AGI的可能性与瓶颈。重点关注了GaLore算法在消费级GPU上训练大模型的可行性和效率提升。还探讨了Transformer架构的优势和局限，以及Sora视频生成模型的一致性和世界模型的可能性。讨论了合成数据在训练大模型中的作用和局限，并强调了竞争对人工智能模型进步的重要性。嘉宾还分享了田渊栋的科幻小说创作灵感和创作过程。

Outlines

Continue

Preview

How to Get Rich: Every EpisodeNaval

E145|对话Meta田渊栋：被Transformer改变的世界与人类AGI的野心

硅谷101|中国版

田渊栋：神经网络如何工作？从围棋到 AGI

从围棋到夏威夷，再到语言模型：一位研究者的探索之旅

GaRole文章解读：在消费级GPU上训练大模型

Lora 的局限性与优化梯度的低秩特性

大模型的规模瓶颈与AGI的突破

神经网络的瓶颈与突破：探索算法提升之路

Transformer架构的优势与局限

从第一线原理出发，探索和利用并行推进

SORA的惊喜之处：一致性

Sora是否是一个世界模型？

Sora世界模型的挑战与局限

合成数据训练大模型：趋势与局限

合成数据与大语言模型的未来

竞争推动人工智能模型进步：GPT-4与Meta开源的启示

田渊栋的科幻小说创作灵感

E145|对话Meta田渊栋：被Transformer改变的世界与人类AGI的野心

硅谷101|中国版

00:01田渊栋：神经网络如何工作？从围棋到 AGI

田渊栋：神经网络如何工作？从围棋到 AGI

05:29从围棋到夏威夷，再到语言模型：一位研究者的探索之旅

从围棋到夏威夷，再到语言模型：一位研究者的探索之旅

10:43GaRole文章解读：在消费级GPU上训练大模型

GaRole文章解读：在消费级GPU上训练大模型

14:27Lora 的局限性与优化梯度的低秩特性

Lora 的局限性与优化梯度的低秩特性

16:57大模型的规模瓶颈与AGI的突破

大模型的规模瓶颈与AGI的突破

20:39神经网络的瓶颈与突破：探索算法提升之路

神经网络的瓶颈与突破：探索算法提升之路

24:21Transformer架构的优势与局限

Transformer架构的优势与局限

27:42从第一线原理出发，探索和利用并行推进

从第一线原理出发，探索和利用并行推进

30:19SORA的惊喜之处：一致性

SORA的惊喜之处：一致性

33:08Sora是否是一个世界模型？

Sora是否是一个世界模型？

35:48Sora世界模型的挑战与局限

Sora世界模型的挑战与局限

39:10合成数据训练大模型：趋势与局限

合成数据训练大模型：趋势与局限

42:12合成数据与大语言模型的未来

合成数据与大语言模型的未来

45:44竞争推动人工智能模型进步：GPT-4与Meta开源的启示

竞争推动人工智能模型进步：GPT-4与Meta开源的启示

49:47田渊栋的科幻小说创作灵感

田渊栋的科幻小说创作灵感