91. 逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”

本期访谈节目重点解读了 DeepSeek 公司及其一系列研究论文，主持人张小珺与香港科技大学助理教授何俊贤围绕 DeepSeek 大模型的技术路线和创新展开讨论。何俊贤老师从 DeepSeek 的第一篇论文开始，详细讲解了 DeepSeek LLM、MOE 模型、V2、V3 以及 R1 等模型的技术细节，并重点分析了 DeepSeek 在模型推理方面的创新，例如多头潜在注意力机制 (MLA) 和 GRPO 算法。访谈还探讨了 DeepSeek 公司独特的文化和发展策略，例如其对成本效率的极致追求和对科研的严谨态度，以及在强化学习方面的探索和对刷榜行为的坦诚态度。通过对这些论文的解读，听众可以更深入地理解 DeepSeek 的技术发展历程及其在 AGI 领域的贡献。

Outlines

Part 1: 节目与DeepSeek公司介绍

Part 2: DeepSeek LLM系列论文解读

Part 3: DeepSeek推理模型论文解读

Part 4: DeepSeek研究总结与展望

Sign in to continue reading, translating and more.

Continue

张小珺Jùn｜商业访谈录

Part 1: 节目与DeepSeek公司介绍

节目介绍及何俊贤老师背景

DeepSeek 公司的底层基因和特性

Part 2: DeepSeek LLM系列论文解读

DeepSeek LLM 论文解读

DeepSeek MOE 和 DeepSeek V2 论文解读

DeepSeek V3 论文解读

Part 3: DeepSeek推理模型论文解读

DeepSeek 推理模型论文解读 (DeepSeek Coder, DeepSeek Math)

DeepSeek 推理模型论文解读 (DeepSeek Prover, DeepSeek R1)

Part 4: DeepSeek研究总结与展望

DeepSeek 研究总结与未来展望

91. 逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”

张小珺Jùn｜商业访谈录

Part 1: 节目与DeepSeek公司介绍

01:15节目介绍及何俊贤老师背景

节目介绍及何俊贤老师背景

14:13DeepSeek 公司的底层基因和特性

DeepSeek 公司的底层基因和特性

Part 2: DeepSeek LLM系列论文解读

19:58DeepSeek LLM 论文解读

DeepSeek LLM 论文解读

45:06DeepSeek MOE 和 DeepSeek V2 论文解读

DeepSeek MOE 和 DeepSeek V2 论文解读

1:05:49DeepSeek V3 论文解读

DeepSeek V3 论文解读

Part 3: DeepSeek推理模型论文解读

1:40:16DeepSeek 推理模型论文解读 (DeepSeek Coder, DeepSeek Math)

DeepSeek 推理模型论文解读 (DeepSeek Coder, DeepSeek Math)

2:05:03DeepSeek 推理模型论文解读 (DeepSeek Prover, DeepSeek R1)

DeepSeek 推理模型论文解读 (DeepSeek Prover, DeepSeek R1)

Part 4: DeepSeek研究总结与展望

2:59:31DeepSeek 研究总结与未来展望

DeepSeek 研究总结与未来展望