15 Nov 2023

LW - Testbed evals: evaluating AI safety even when it can't be directly measured by joshc

The Nonlinear Library

The Nonlinear Library - LW - Testbed evals: evaluating AI safety even when it can't be directly measured by joshc

Preview

How to Get Rich: Every EpisodeNaval