YouTube30 Sept 2025
20m

【人工智能】DeepSeek发布新模型V3.2-Exp | 全新DSA稀疏注意力机制 | 闪电索引器 | 长上下文效率优化 | 细粒度的token选择 | MLA架构 | 密集预热+稀疏训练 | 蒸馏

Podcast cover

最佳拍档

Open in Podwise to generate AI notes

Sign in to process this episode and unlock summaries, transcripts, highlights and translations.

Open in Podwise

Shownotes are not generated by Podwise.

【人工智能】DeepSeek发布新模型V3.2-Exp | 全新DSA稀疏注意力机制 | 闪电索引器 | 长上下文效率优化 | 细粒度的token选择 | MLA架构 | 密集预热+稀疏训练 | 蒸馏