Trending
Ask AI
Library
You
Sign in
Help
Toggle theme
SIGN IN
Prev
Next
Summary
Mindmap
Transcript
Keywords
Highlights
Shownotes
Trending
Ask AI
Library
You
Enjoy Podwise!
00:00
00:00
1x
10
10
Enjoy Podwise!
Detail
Transcript
89. 逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净” | 张小珺Jùn|商业访谈录 | Podwise
Prev
Next
04 Feb 2025
2h
49m
89. 逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净”
张小珺Jùn|商业访谈录
Play
Summary
Mindmap
Transcript
Keywords
Highlights
Shownotes
Sign in to access all AI-generated content
Continue
这是一期技术解读类访谈播客,加州大学伯克利分校人工智能实验室博士生潘家怡作为嘉宾,与主持人张小珺共同解读了 DeepSeek 近期发布的 DeepSeek R1 和 R1.0 模型,以及与之相关的 Kimi 1.5 模型和 OpenAI 的 O1 模型。访谈首先探讨了 DeepSeek 模型对 AGI 领域的影响,以及与 OpenAI 模型的异同,之后潘家怡详细讲解了 DeepSeek R1 论文的核心内容,包括其采用的强化学习算法 GRPO,奖励函数设计,以及模型训练过程中的关键步骤和技术细节,例如 “aha moment” 的出现。最后,访谈还讨论了模型成本估算、数据标注的重要性以及未来研究方向等问题,例如 DeepSeek R1 的训练成本可能在 10 万到 100 万美元之间。通过此次访谈,听众可以深入了解当前大模型领域强化学习技术路线的最新进展,以及相关模型的优缺点和未来发展趋势。
Takeaways
Outlines
Q & A
Preview
How to Get Rich: Every Episode
Naval