Entrelazamiento de valores: confusión entre lo moral, gramatical y económico en LLMs
Investigación revela que los modelos de lenguaje grandes confunden el valor moral, gramatical y económico. Descubre cómo la ablación selectiva corrige este entrelazamiento y mejora la alineación.