El aprendizaje subliminal es un artefacto de LoRA
El aprendizaje subliminal en modelos de lenguaje es un artefacto de LoRA: un fenómeno frágil que depende del rango y contexto, y desaparece con fine-tuning completo.
El aprendizaje subliminal en modelos de lenguaje es un artefacto de LoRA: un fenómeno frágil que depende del rango y contexto, y desaparece con fine-tuning completo.