从Sora展开，全面解读AI视频大模型发展史（上）

本期播客主要探讨了 OpenAI 的 AI 视频生成模型 Sora，及其在生成式 AI 视频领域的技术发展。节目首先回顾了 Runway 和 Pika Labs 等早期 AI 视频模型的局限性，然后详细介绍了 Sora 的突破性进展，包括视频长度、一致性、输入方式和时间连贯性等方面的提升。接着，深入分析了 AI 生成视频的两种主要技术路线：扩散模型和 Transformer 模型，并邀请了 Meta 的 Make a Video 模型论文作者张颂阳博士解释其原理。最后，探讨了 OpenAI 将扩散模型和 Transformer 模型结合的 Sora 模型，以及这种结合在 AI 视频生成领域中的潜力与争议，并预告了下期关于 “世界模型” 的讨论。

Outlines

Sign in to continue reading, translating and more.