本期播客由主持人 Sam Charrington 对话独立 LLM 研究员 Sebastian Raschka,探讨了大语言模型(LLM)领域的最新动态与未来发展趋势。对话聚焦于推理训练的重要性,强调其在提升模型解决复杂问题能力上的作用,并指出目前研发重心已从预训练转向后期训练,以期从中挖掘更多性能。Raschka 分享了自己使用 LLM 的实际案例,如利用 ChatGPT 提取 PDF 标题和开发 macOS App 以简化工作流程,并强调了 LLM 在开发特定任务工具上的潜力。双方还讨论了 Inference Scaling、Agentic 应用以及多智能体系统,并对 LLM 架构的未来发展方向、持续学习以及长文本窗口等问题进行了展望。
Outlines
Part 1: 技术趋势、推理与工具演进
Part 2: 工作流自动化、自定义工具开发
Part 3: 推理训练、奖励模型与扩展技术
Part 4: 架构创新、多智能体与未来展望
Part 5: 实践指南、新书介绍
Sign in to continue reading, translating and more.
Open full episode in Podwise