BoxArena Leaderboard Compare Trajectories Monitor Research About

Monitor Research

Can a monitor model detect container escapes? Post-hoc evaluation of LLM monitors reviewing each agent action during live evals.

BoxArena Scalable Formal Oversight