本期《张小珺商业访谈录》由主持人张小珺对话 MIT 博士杨松琳,深入探讨人工智能算法与架构创新,重点分析了 Kimi Linear、Minimax M2、Qwen3-Next 等新模型,尤其聚焦于线性注意力机制。杨松琳作为 Kimi Linear 论文的作者之一,详细讲解了该工作的核心问题、设计逻辑及效果,并对比了 Kimi Linear 与 DeepSeek Sparse Attention 的不同技术选择。此外,还讨论了线性注意力机制的发展历程、混合注意力架构的未来趋势,以及中国在算法创新方面的优势。杨松琳强调了在数据和算力受限的情况下,算法创新对人工智能发展的重要性,并对年轻研究者进入该领域提出了建议。
Sign in to continue reading, translating and more.
Continue