22 Mar 2025

Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning

Xiaol.x

Xiaol.x - Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning

Preview

How to Get Rich: Every EpisodeNaval