#614.NVIDIA 核心科学家 Bryan Catanzaro：当算力堆到极限，开源模型如何靠“效率”继续变强

NVIDIA 通过构建 Nemotron 开源模型家族，致力于推动 AI 基础设施的深度优化与生态繁荣。该模型系列（包括 Nano、Super 和 Ultra）采用混合专家（MOE）架构与状态空间模型（SSM），结合 4 位精度预训练技术，在有限算力下实现了推理效率与模型智能的平衡。作为 NVIDIA 应用深度学习研究副总裁，Bryan Catanzaro 指出，AI 研发的核心在于从第一性原理出发，通过跨部门协作解决摩尔定律失效后的计算瓶颈。此外，开源 AI 模式通过透明的社区协作，不仅加速了技术迭代，还为解决气候变化等复杂全球性问题提供了必要的智能工具。这种以 “外部大脑” 为定位的 AI 发展路径，强调了在多样化环境中通过高效工具实现技术变革的战略意义。

Outlines

Part 1: 开源价值、战略背景

Part 2: Nemotron 演进、架构创新

Part 3: 技术优化、训练方法

Part 4: 协作文化、未来展望

Sign in to continue reading, translating and more.

Open full episode in Podwise

跨国串门儿计划

Part 1: 开源价值、战略背景

开源 AI 的生态价值与全球竞争格局

NVIDIA 的 AI 战略布局与模型研发历程

Part 2: Nemotron 演进、架构创新

Nemotron 家族的演进与生态协作联盟

Nemotron 架构创新：混合专家与状态空间模型

Part 3: 技术优化、训练方法

推理效率优化与多 Token 预测技术

模型训练方法论：多教师蒸馏与合成数据

Part 4: 协作文化、未来展望

NVIDIA 内部协作文化与算力资源分配

AI 发展的未来展望与安全性探讨

#614.NVIDIA 核心科学家 Bryan Catanzaro：当算力堆到极限，开源模型如何靠“效率”继续变强

跨国串门儿计划

Part 1: 开源价值、战略背景

02:46开源 AI 的生态价值与全球竞争格局

开源 AI 的生态价值与全球竞争格局

09:12NVIDIA 的 AI 战略布局与模型研发历程

NVIDIA 的 AI 战略布局与模型研发历程

Part 2: Nemotron 演进、架构创新

18:00Nemotron 家族的演进与生态协作联盟

Nemotron 家族的演进与生态协作联盟

26:52Nemotron 架构创新：混合专家与状态空间模型

Nemotron 架构创新：混合专家与状态空间模型

Part 3: 技术优化、训练方法

37:17推理效率优化与多 Token 预测技术

推理效率优化与多 Token 预测技术

41:44模型训练方法论：多教师蒸馏与合成数据

模型训练方法论：多教师蒸馏与合成数据

Part 4: 协作文化、未来展望

47:17NVIDIA 内部协作文化与算力资源分配

NVIDIA 内部协作文化与算力资源分配

57:13AI 发展的未来展望与安全性探讨

AI 发展的未来展望与安全性探讨