25 Mar 2026
58m

GTC 2026:AI的下一个战场不是模型,而是「推理系统」| S10E04

Podcast cover

What's Next|科技早知道

本期科技早知道聚焦英伟达 GTC 大会,探讨 AI 推理层面的最新进展。Diane 在 GTC 现场采访了推理公司 Eigen 的代表,深入解析了 GPU、LPU 和 TPU 三种芯片架构的区别与优化方向,指出 LPU 是英伟达未来的重要优化方向。Eigen 的代表分享了 Agent 爆发给行业带来的启发,强调开源模型在资源调度和优化方面的新商业空间。他们还讨论了推理速度、token 优化以及不同硬件选择对 AI 应用的影响,并分析了当前行业内大、中、小厂在推理速度上的优化策略。此外,还探讨了开源模型与闭源模型在 AGI 领域的竞争,以及 Open Cloud 对开源模型公司带来的机遇。

Outlines

Part 1: GTC 2026 综述与英伟达战略

Part 2: Agent 爆发与 AI 商业化逻辑

Part 3: Eigen 公司背景与技术实力

Part 4: 行业趋势:从训练转向推理

Part 5: 推理层竞争与技术护城河

Part 6: 硬件架构深度解析:GPU, TPU, LPU

Part 7: 推理优化技术详解

Part 8: 应用场景与商业模式挑战

Part 9: 未来展望与行业非共识

Sign in to continue reading, translating and more.

Open full episode in Podwise