23 May 2026
49m

#549. AI 芯片究竟如何工作?GPU/TPU 的底层设计

Podcast cover

跨国串门儿计划

AI 芯片设计的核心在于通过优化矩阵乘法运算,平衡计算吞吐量与底层通信成本。矩阵乘法作为 AI 计算的基础,其效率取决于如何有效处理数据移动,因为从寄存器文件到逻辑单元的传输开销远高于逻辑运算本身。通过引入脉冲阵列(Systolic Array)等固定功能逻辑块,芯片设计者能够将权重矩阵本地化存储,从而显著降低带宽压力并提升算力密度。此外,时钟周期的设定与流水线寄存器的插入是性能优化的关键,需在时钟频率、面积开销与确定性延迟之间进行精细权衡。MADX 公司 CEO Reiner Pope 深入剖析了从逻辑门、查找表到大规模加速器的演进逻辑,揭示了 GPU 与 TPU 在架构设计上的本质差异及其对能效和吞吐量的深远影响。

Outlines

Sign in to continue reading, translating and more.

Open full episode in Podwise