29 May 2025
34m

#128. 当AI学会“思考”:从Claude看RL、推理、工具使用及伦理红线

Podcast cover

跨国串门儿计划

本播客是 “跨国串门计划” 的一部分,旨在为中文听众提供全球优质外语播客的无障碍体验。通过 AI 语音克隆技术,该节目将外语播客翻译成中文,并保留原主持人和嘉宾的声音。本期节目克隆了 AI 技术播客 Latent Space,由 Alessio Fanelli 和 SWYX 共同主持,并邀请了 Prime Intellect 的 Will Brown,深入探讨了 Anthropic Cloud 系列模型的最新进展和技术细节,包括模型如何从强调推理能力转向实际应用,以及如何解决 AI 训练中的奖励破解问题,并探讨了模型评估所面临的挑战。

Outlines

Part 1: 节目介绍与模型概览

Part 2: AI安全与成本控制

Part 3: 强化学习与未来展望

Sign in to continue reading, translating and more.

Open full episode in Podwise