08 Feb 2025

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Xiaol.x

Xiaol.x - SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Preview

How to Get Rich: Every EpisodeNaval