Reevaluación psicométrica de LLMs: autoinformes y comportamiento
Descubre cuándo autoinformes de LLMs predicen su comportamiento. Estudio revela que Teoría del Comportamiento Planificado supera al Big Five en coherencia.
Descubre cuándo autoinformes de LLMs predicen su comportamiento. Estudio revela que Teoría del Comportamiento Planificado supera al Big Five en coherencia.
Un estudio con 25 modelos de lenguaje revela que sus autoevaluaciones no coinciden con su comportamiento. Descubre por qué es un riesgo para la IA.
¿Modelo conjunto o secuencial? El método elegido puede alterar conclusiones sobre progreso lector. Estudio revela cuándo es más fiable el análisis conjunto.
Descubre por qué los SLMs miden artefactos de prompt, no rasgos psicológicos. Un estudio revela cómo los sesgos de cumplimiento dominan las evaluaciones.
Descubre GenPT, un innovador método de psicometría para LLM que evita sesgos de autoinforme mediante pruebas proyectivas generativas. Mayor fiabilidad y sensibilidad contextual.