本期节目探讨了 AI 模型发展的上下半场问题,嘉宾丁丁分享了她从 Kimi 早期产品经验出发,对 OpenAI 文章 “AI 的下半场” 的理解。丁丁认为,当前阶段定义问题比单纯追求 Benchmark 刷分更重要,因为现有 Benchmark 与实际业务场景和用户需求存在差距。回顾 AI 发展的上半场,大家主要致力于提升基础模型能力和挖掘 pre-train 潜力,提示词工程曾被高度重视,但随着模型能力的提升,对提示词的要求逐渐简化。节目中,嘉宾还讨论了数据对模型进展的重要性,强调高质量用户数据与模型能力提升需保持一致,并分析了 DAU 作为衡量指标的局限性。最后,嘉宾总结了在模型公司工作的收获,强调了模型评估和 Benchmark 认知的重要性,并分享了 AI 产品经理与传统产品经理的异同,以及对模型能力边界的理解和预判。