03 Nov 2025
1h 43m

119. Kimi Linear、Minimax M2?和杨松琳考古算法变种史,并预演未来架构改进方案

Podcast cover

张小珺Jùn|商业访谈录

本期《张小珺商业访谈录》由主持人张小珺对话 MIT 博士杨松琳,深入探讨人工智能算法与架构创新,重点分析了 Kimi Linear、Minimax M2、Queen3Next 等新模型。杨松琳作为 Kimi Linear 论文的作者之一,详细解读了线性注意力机制,讨论了数据瓶颈下算法创新的重要性,以及中国 AI 算法在算力限制下的发展优势。访谈内容涵盖 DeepSeek 的 MOE 混合专家模型、Sparse Attention、Linear Attention 等技术押注,并对 Kimi Linear 的设计逻辑、性能表现,以及 Minimax 在 Attention 机制上的选择与反复进行了分析,同时也探讨了硅谷公司在混合注意力机制上的探索方向。杨松琳还分享了线性注意力机制的发展线索,以及 Linear Attention 和 Sparse Attention 的未来结合的可能性,并对 Transformer 架构的未来演进方向提出了自己的见解。

Outlines

Part 1: 算法创新与线性注意力机制

Part 2: Kimi Linear 技术细节

Part 3: Linear Attention 的发展与应用

Part 4: 算法研究与职业思考

Sign in to continue reading, translating and more.

Open full episode in Podwise