YouTube17 Dec 2024
13m

【人工智能】o1 pro架构揭秘 | Semianalysis长文剖析推理训练架构 | Claude 3.5 Opus失败了么 | Scaling Laws或会持续 | 草莓训练 | token经济学

Podcast cover

最佳拍档

本期播客深入探讨了 Semianalysis 发布的一篇有关大模型架构和 Scaling Laws 的文章。文章分析了 OpenAI 的 O1 和 O1 Pro 模型的推理架构,以及 Anthropic 的 Claude 3.5 Opus 模型在实际应用中的表现。同时,还讨论了大模型推理成本高昂的原因,以及 Scaling Laws 在预训练和推理过程中的有效性。尽管 AI 领域面临诸多挑战,随着新技术的发展,Scaling Laws 仍将持续发挥作用。

Outlines

Sign in to continue reading, translating and more.

Open full episode in Podwise