15 May 2024
1h 16m

多模态GPT-4o的诗与远方,和走进田野与工厂的大模型-Vol48

Podcast cover

脑放电波

本期播客节目介绍了OpenAI和谷歌在AI方面的最新进展,包括多模态能力的增强和AI搜索的商业应用。通过多模态能力,用户可以通过视频对话和共享投屏与AI进行交互。AI的语音功能也得到了改进,具备了丰富的语气和情感对话。在搜索方面,谷歌的Gemini重塑了搜索引擎,具备了多步骤推理的能力,并可以列出详细计划。OpenAI的ChatGPT接入了搜索能力,提供实时答案和索引。本节还讨论了多模态的概念、商业落地和可靠数据的获取方式。

Outlines

Sign in to continue reading, translating and more.

Open full episode in Podwise