本期播客主要探讨了 AI 语音智能体的发展与应用,以及 Fish Audio 在该领域的创新与实践。Fish Audio 的两位创始人 Rissa 和冷月分享了他们如何通过开源模型和用户生成内容(UGC)的生态系统,迅速成为全球第二大的 AI 语音平台,并在过去一年实现了 13 倍的增长和 1000 万美元的 ARR。讨论深入探讨了 Fish Audio 的核心技术,如 S1 和 S2 模型,以及它们在情感控制、多语种支持和低延迟方面的优势。他们还强调了高质量数据的重要性,以及如何通过独特的数据管线和强化学习来提升模型表现力,尤其是在处理包含噪声和情感的语音数据方面。
Sign in to continue reading, translating and more.
Continue