144: 从「大而强」到「小而强」，密度法则、RL 的 Scaling Law 和智能的分布式未来

本期晚点聊邀请清华大学的刘知远和肖朝军，探讨大模型密度法则。他们指出，尽管业界普遍关注模型性能提升，但能效提升同样重要，并类比芯片发展，认为大模型也应追求 “摩尔定律”。密度法则旨在提升单位参数或开销下的智能转化率，避免资源浪费。讨论中，嘉宾解析了架构、数据、算法和软硬协同四个提升模型密度的关键层面，并结合 DeepSeek V3、MINIMAX 等实例，阐释了稀疏 MoE 架构、高质量数据及强化学习对效率的促进作用。刘知远预测，2027 年端侧设备有望支持具备自我学习能力的大模型，实现真正的个性化智能。

Outlines

Part 1: 密度法则：大模型的新叙事

Part 2: 面壁智能：技术路径与 MiniCPM

Part 3: 提升密度：架构、数据与算法

Part 4: 强化学习与软硬协同

Part 5: 落地应用：端侧智能与商业逻辑

Part 6: 展望：AGI 与智能社会

Sign in to continue reading, translating and more.

Open full episode in Podwise

晚点聊 LateTalk

Part 1: 密度法则：大模型的新叙事

00:04晚点聊：清华大学刘知远、肖朝军谈大模型的密度法则

晚点聊：清华大学刘知远、肖朝军谈大模型的密度法则

00:35大模型发展趋势：能力更强与能效更高并重

大模型发展趋势：能力更强与能效更高并重

02:29新模型亮点：智能体化与多模态数据融合

新模型亮点：智能体化与多模态数据融合

04:15大模型发展的两条主线：能力更强与能效更高

大模型发展的两条主线：能力更强与能效更高

05:35规模法则的局限性：训练与使用成本线性增长

规模法则的局限性：训练与使用成本线性增长

06:35实现人工智能普及的关键：提升模型能效

实现人工智能普及的关键：提升模型能效

08:24效率改进成共识：开源与闭源都在追寻效率提升

效率改进成共识：开源与闭源都在追寻效率提升

10:23密度法则：打破唯算力论，追求人工智能高效发展

密度法则：打破唯算力论，追求人工智能高效发展

12:36密度法则：一种人工智能的自我实现

密度法则：一种人工智能的自我实现

14:39密度法则：逆熵增，技术创新驱动秩序

密度法则：逆熵增，技术创新驱动秩序

16:17物竞天择：商业竞争推动模型高效发展

物竞天择：商业竞争推动模型高效发展

17:32密度法则：强调智能转化率，应对资源瓶颈

密度法则：强调智能转化率，应对资源瓶颈

18:43密度法则核心：追求单位参数下智能转化率

密度法则核心：追求单位参数下智能转化率

20:24能力密度加速增长：ChatGPT 出现前后对比

能力密度加速增长：ChatGPT 出现前后对比

Part 2: 面壁智能：技术路径与 MiniCPM

21:11面壁智能的抉择：不追逐 GPT-4，构建模型风洞

面壁智能的抉择：不追逐 GPT-4，构建模型风洞

23:57MiniCPM 的诞生：技术创新提升模型效率

MiniCPM 的诞生：技术创新提升模型效率

25:44能力密度指标的迭代：从基座模型到后训练技术

能力密度指标的迭代：从基座模型到后训练技术

Part 3: 提升密度：架构、数据与算法

26:42提升模型密度：架构、数据、算法、软硬一体

提升模型密度：架构、数据、算法、软硬一体

27:11提升模型密度：模型架构、数据治理、模型风洞、软硬协同

提升模型密度：模型架构、数据治理、模型风洞、软硬协同

29:37提升模型密度：软硬协同与定量关系探索

提升模型密度：软硬协同与定量关系探索

30:47架构层面：FFN 做稀疏 MoE，Attention 应对长模型瓶颈

架构层面：FFN 做稀疏 MoE，Attention 应对长模型瓶颈

32:25DeepSeek 的揭示：从非共识到共识的转折点

DeepSeek 的揭示：从非共识到共识的转折点

33:18架构：智能的容器，数据：模型学习的教材

架构：智能的容器，数据：模型学习的教材

34:25面壁智能的数据治理体系：L0 到 L4 分层处理

面壁智能的数据治理体系：L0 到 L4 分层处理

35:59数据治理：构建最小化数据集，追寻智能本质

数据治理：构建最小化数据集，追寻智能本质

37:38数据质量与数量：模型达到更高水平的基础

数据质量与数量：模型达到更高水平的基础

39:21构建智能系统：复杂精密的体系，环节众多

构建智能系统：复杂精密的体系，环节众多

Part 4: 强化学习与软硬协同

40:30算法：强化学习的 Scaling 问题

算法：强化学习的 Scaling 问题

41:12强化学习：环境与数据 Scaling 是关键

强化学习：环境与数据 Scaling 是关键

43:01强化学习：任务精通与 AGI 的矛盾

强化学习：任务精通与 AGI 的矛盾

44:05强化学习：学习效率与环境反馈

强化学习：学习效率与环境反馈

45:30强化学习：价值函数与世界建模

强化学习：价值函数与世界建模

47:00算法：补足 RL Scaling 规律，探索开放语强化学习

算法：补足 RL Scaling 规律，探索开放语强化学习

49:21软硬件协同：计算机发展的核心主线

软硬件协同：计算机发展的核心主线

50:31软硬件协同：Transformer 与 Flash Attention

软硬件协同：Transformer 与 Flash Attention

51:16软硬件协同：设计算法与硬件

软硬件协同：设计算法与硬件

52:31InfLLM 第二代：训练阶段做到语言稀疏

InfLLM 第二代：训练阶段做到语言稀疏