#t1-bench

T1-Bench: Evaluación de Agentes Multi-Escenario en Dominios Reales

Descubre T1-Bench, el benchmark que evalúa agentes de IA en entornos multi-dominio y multi-turno con rigurosidad. ¡Optimiza tus sistemas!

T1-Bench revoluciona la evaluación de agentes con escenarios intercalados y 25 dominios. ¿Tu modelo supera la prueba? Conoce los resultados.