HINTBench: Banco de Pruebas de Trayectoria Intrínseca No Ataque de Agente Horizonte
HINTBench es una plataforma de benchmarking que evalúa la capacidad de los agentes de inteligencia artificial para navegar entornos sin atacar. ¡Descubre cómo funciona!