STAGE-Claw: Evaluación automatizada de agentes en escenarios realistas Descubre STAGE-Claw, un framework automatizado que evalúa agentes de IA en escenarios realistas midiendo la corrección del estado final del sistema. Ideal para benchmarks. 2026-06-10 · 3 min