NeuroState-Bench: Un punto de referencia calibrado por humanos para la integridad del compromiso en perfiles de agentes LLM
NeuroState-Bench: benchmark calibrado por humanos para evaluar la integridad del compromiso en agentes LLM. Mide coherencia y fiabilidad de modelos de lenguaje.