本期播客采访了 Gemini 3 项目的预训练负责人 Sebastian Burr,深入探讨了该模型成功的秘诀。Burr 认为,Gemini 3 的突破并非源于单一技术创新,而是由一个超过 200 人的团队在模型、数据、基础设施和评估等多维度上共同努力的结果。他强调了团队协作的重要性,以及在有限数据范式下,架构创新和数据创新的价值日益凸显。Burr 还分享了对于研究质量的看法,包括研究的互补性、对复杂性的警惕以及研究的敏锐度。此外,他还谈到了长文本能力、注意力机制以及评估在预训练中的重要性,并对人工智能领域的未来发展趋势进行了展望。
Sign in to continue reading, translating and more.
Continue