本期播客深入探讨推荐系统中稀疏特征及其嵌入最新趋势。首先,我们回顾了稀疏特征的基本概念以及其在模型中的应用,特别是如何通过嵌入查找表将 ID 转化为稠密向量。接着,讨论围绕三个重点展开:稀疏特征的可共享性、学习到的嵌入的泛化能力,以及哈希技巧的应用。我们介绍了美团和 Google 在利用大型语言模型以提升推荐系统泛化能力方面的最新研究,特别是如何通过预训练模型和对比学习来整合语义信息与协同信号。最后,播客还探讨了 YouTube 如何通过语义 ID 优化哈希技巧,以解决哈希冲突问题。通过这些实例,我们希望帮助听众更好地理解稀疏特征在推荐系统中的发展和实际应用。