Corriendo el guante: reevaluando las capacidades de agentes IA Descubre GauntletBench: expone las limitaciones de agentes IA - solo 19% éxito vs 80% humano en tareas complejas. ¿Listos para el mundo real? 2026-06-15 · 2 min