01 Aug 2023

AF - ARC Evals new report: Evaluating Language-Model Agents on Realistic Autonomous Tasks by Beth Barnes

The Nonlinear Library

The Nonlinear Library - AF - ARC Evals new report: Evaluating Language-Model Agents on Realistic Autonomous Tasks by Beth Barnes

Preview

How to Get Rich: Every EpisodeNaval