本期访谈节目重点解读了 DeepSeek 公司及其一系列研究论文,主持人张小珺与香港科技大学助理教授何俊贤围绕 DeepSeek 大模型的技术路线和创新展开讨论。何俊贤老师从 DeepSeek 的第一篇论文开始,详细讲解了 DeepSeek LLM、MOE 模型、V2、V3 以及 R1 等模型的技术细节,并重点分析了 DeepSeek 在模型推理方面的创新,例如多头潜在注意力机制 (MLA) 和 GRPO 算法。访谈还探讨了 DeepSeek 公司独特的文化和发展策略,例如其对成本效率的极致追求和对科研的严谨态度,以及在强化学习方面的探索和对刷榜行为的坦诚态度。通过对这些论文的解读,听众可以更深入地理解 DeepSeek 的技术发展历程及其在 AGI 领域的贡献。
Sign in to continue reading, translating and more.
Continue