本期《编码人声》播客节目讨论了大语言模型 DeepSeek 爆火背后的原因及对 AI 行业的影响,以及 AI 未来发展趋势。两位嘉宾,一位从事实时 AI 创业,一位是声网大模型实验室高级研究员,分别从世界模型和全双工语音交互两个角度,探讨了模型落地应用中用户体验、实时性、以及环境感知等问题。节目中,声网嘉宾演示了其正在开发的全双工 AI 模块,该模块允许 AI 主动静音或打断用户,更贴近人类自然对话。 两位嘉宾都预测到 2025 年,多模态模型、Agent 技术以及更强大的实时推理能力将成为 AI 应用的重要发展方向。 例如,智能眼镜结合 Agent 技术,将可能实现更自然的交互和更广泛的应用场景。
Sign in to continue reading, translating and more.
Continue