#flujos reales

¿Están los agentes listos para enseñar? Un benchmark multi-etapa para flujos de trabajo de enseñanza en el mundo real.

Benchmark multi-etapa que evalúa si los agentes de IA están listos para enseñar en flujos reales. Descubre los resultados.