本期播客对 DeepSeek 新发布的多模态大模型 JanusPro 进行了深入分析。播客首先解读了 JanusPro 的技术论文,着重介绍了其统一的多模态理解和生成架构,以及改进的训练策略和数据规模。接着,播客进行了实测,比较了 JanusPro 与其他模型在图像生成方面的效果,发现其生成效果并非如宣传中那样完美,尤其在图像细节方面仍有提升空间。最后,播客总结了 JanusPro 及其前代模型的发展历程,并探讨了多模态大模型发展中面临的挑战和未来方向,例如离散与连续特征的选择以及多模态 Scaling Law 的研究。
Sign in to continue reading, translating and more.
Continue