YouTube11 May 2024
15m

分布式PTD多维并行与GPU集群关系 #大模型 #分布式并行 #分布式训练

Podcast cover

ZOMI酱

本期播客节目详细介绍了大模型的分布式训练过程中的模型并行配置和节点关系,着重介绍了通讯域的选择和并行配置的相关概念。通过讲解张量并行和Pipeline并行的使用方法,以及并行计算中的并行通讯和反向传播时的集合通讯,让听众对模型并行配置和节点关系有了更深入的了解。

Outlines

Sign in to continue reading, translating and more.

Open full episode in Podwise