Trending
Ask AI
Library
You
Sign in
Help
Toggle theme
SIGN IN
Prev
Next
Summary
Mindmap
Transcript
Keywords
Highlights
Shownotes
Trending
Ask AI
Library
You
Enjoy Podwise!
00:00
00:00
1x
10
10
Enjoy Podwise!
Detail
Transcript
94. 逐篇讲解DeepSeek、Kimi、MiniMax注意力机制新论文——“硬件上的暴力美学” | 张小珺Jùn|商业访谈录 | Podwise
Prev
Next
23 Feb 2025
2h
36m
94. 逐篇讲解DeepSeek、Kimi、MiniMax注意力机制新论文——“硬件上的暴力美学”
张小珺Jùn|商业访谈录
Play
Summary
Mindmap
Transcript
Keywords
Highlights
Shownotes
Sign in to access all AI-generated content
Continue
本期播客访谈 MIT 博士生杨松琳,解读 DeepSeek、Kimi 和 MiniMax 三家公司近期发布的关于注意力机制改进的论文。访谈首先介绍了注意力机制的概念和重要性,然后深入分析了三篇论文的技术细节,特别是 DeepSeek 提出的 Native Sparse Attention,该方法在长文本处理上展现出优于 Full Attention 的性能,并在训练和推理阶段都实现了高效性。最后,讨论了不同公司在技术哲学和优化目标上的差异,以及未来注意力机制优化可能的方向。 通过对论文的解读,听众可以了解 AI 大模型领域最新的技术进展和不同公司背后的技术路线选择。
Takeaways
Outlines
Q & A
Preview
How to Get Rich: Every Episode
Naval