SoCRATES: Benchmark para evaluación fiable de mediadores LLM proactivos
SoCRATES: benchmark evalúa mediadores LLM en 8 dominios y 5 ejes socio-cognitivos. Logra 82% alineación humana. ¿Puede la IA mediar?
SoCRATES: benchmark evalúa mediadores LLM en 8 dominios y 5 ejes socio-cognitivos. Logra 82% alineación humana. ¿Puede la IA mediar?