¿Creen los modelos lo que dicen al rolear?
Un estudio revela que al rolear, los LLMs cambian lo que dicen pero no su representación interna. La desalineación emergente sí altera las creencias.
Un estudio revela que al rolear, los LLMs cambian lo que dicen pero no su representación interna. La desalineación emergente sí altera las creencias.
¿Los LLM creen realmente sus afirmaciones al interpretar personajes? Un estudio revela diferencias entre roleplaying y desalineación emergente.
Descubre PoliticsBench, un benchmark que evalúa valores políticos en modelos de lenguaje mediante roleplay interactivo. ¿Qué sesgos revela?