¿Están los agentes listos para enseñar? Un benchmark multi-etapa para flujos de trabajo de enseñanza en el mundo real. Benchmark multi-etapa que evalúa si los agentes de IA están listos para enseñar en flujos reales. Descubre los resultados. 2026-05-15 · 2 min