21 Jan 2025

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcement Learning

Xiaol.x

Xiaol.x - DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcement Learning

Preview

How to Get Rich: Every EpisodeNaval