Consenso oculto: compresión de validez en feedback humano
El paper 'Hidden Consensus' revela cómo la agregación mayoritaria en RLHF oculta preferencias plurales. Descubre por qué la mayoría no mide alineación real.
El paper 'Hidden Consensus' revela cómo la agregación mayoritaria en RLHF oculta preferencias plurales. Descubre por qué la mayoría no mide alineación real.
Los LLM se dejan engañar fácilmente por respuestas mayoritarias. Un estudio revela que es más fácil inducir errores que corregirlos en sistemas multiagente.