本期播客节目介绍了史业民老师在多模态模型领域的经验和对GPT-4o的看法。GPT-4o是一个多模态的混合模型,可以处理图像、文字和语言功能。史老师分享了GPT-4o的开放功能以及实时语言互动方面取得的突破。讨论还涉及了数据收集的思考、产品落地能力和发布策略的差异,以及语音合成技术中的版权问题和AI模仿电影演员的能力。另外,还讨论了OpenAI的CPT-5模型的能力和微调能力,以及翻译模型的应用场景和未来发展潜力。最后,讨论了AI助手、实时互联网技术的应用以及大模型在商业角度上的竞争问题。
Sign in to continue reading, translating and more.
Continue