23 Feb 2025
54m

编码人声:DeepSeek 和 OpenAI 都没做到的技术,这群人先实现了

Podcast cover

津津乐道

本期《编码人声》播客节目讨论了大语言模型 DeepSeek 爆火背后的原因及对 AI 行业的影响,以及 AI 未来发展趋势。两位嘉宾,一位从事实时 AI 创业,一位是声网大模型实验室高级研究员,分别从世界模型和全双工语音交互两个角度,探讨了模型落地应用中用户体验、实时性、以及环境感知等问题。节目中,声网嘉宾演示了其正在开发的全双工 AI 模块,该模块允许 AI 主动静音或打断用户,更贴近人类自然对话。 两位嘉宾都预测到 2025 年,多模态模型、Agent 技术以及更强大的实时推理能力将成为 AI 应用的重要发展方向。 例如,智能眼镜结合 Agent 技术,将可能实现更自然的交互和更广泛的应用场景。

Outlines

Part 1: 开场与DeepSeek爆火

Part 2: 大模型交互与全双工技术

Part 3: 未来展望与总结

Sign in to continue reading, translating and more.

Open full episode in Podwise