本期节目采访了 MiniMax 的高级研究员 Olive Song,探讨了 AI 模型开发中的强化学习、模型对齐以及开源策略等问题。Olive 介绍了 MiniMax 在模型对齐方面的工作,强调了定义人类对齐和专家预期,并训练模型以符合这些预期。她还分享了团队如何通过内部基准测试和大规模评估来确保模型安全性,以及如何收集用户反馈以改进模型。此外,Olive 还谈到了开源对于研究团队的重要性,以及 MiniMax 如何利用内部 agent 跟踪最新的研究进展,并将其应用于模型开发中。
Sign in to continue reading, translating and more.
Continue