Library
SIGN IN
Prev
Next
Summary
Mindmap
Transcript
Keywords
Highlights
Shownotes
Send
Trending
Ask AI
Library
You
Sign in
Help
Toggle theme
Trending
Ask AI
Library
You
Enjoy Podwise!
Enjoy Podwise!
Sign in to sync your playlist
Playlist 0/50
Prev
Next
YouTube
09 May 2024
20m
DeepSpeed优化器并行ZeRO1/2/3原理 #大模型 #分布式并行 #训练
ZOMI酱
YouTube
Play
Summary
Mindmap
Transcript
Keywords
Highlights
Shownotes
Sign in to access all AI-generated content
Continue
本期播客节目介绍了DeepSpeed中的优化器并行方式和ZeRO方法在深度学习中的应用。优化器并行通过将模型的优化器状态划分并分配给不同的NPU进行更新,减少通信代价,提高数据并行训练效率。ZeRO方法通过改变显存存储方式和切分优化器状态来节约显存,但增加了单卡通信量。同时还讨论了模型并行和数据并行的概念和原理以及DeepSpeed的使用方式和配置参数。
Takeaways
Outlines
Q & A
Preview
How to Get Rich: Every Episode
Naval