數創實驗室 - AI時代的學習指南 - EP36 | 深談Deepseek (上):開源之王、卓越技術創新、混合專家模型MoE、Multi-Token Prediction (MTP)、多頭潛在注意力機制MLA
Sign in to continue reading, translating and more.