#puntuación ers

Estabilidad vs. Manipulabilidad: Robustez en Jueces de IA

¿Son confiables los jueces de IA? Este estudio revela que aunque estables, pueden revertirse con desafíos posteriores, afectando rankings y preferencias humanas.

2026-06-06 · 3 min

Estabilidad vs. Manipulabilidad: Evaluando Robustez en Jueces LLM

Los jueces LLM son estables en reevaluaciones neutrales, pero vulnerables a retos dirigidos. El ERS mide su robustez interaccional. Conoce sus implicaciones.

2026-06-06 · 2 min