SafeSteer: Destilación localizada en política para alineación eficiente
Descubre SafeSteer: alinea LLMs con seguridad usando solo 100 muestras dañinas, preservando capacidades generales y reduciendo costes.
Descubre SafeSteer: alinea LLMs con seguridad usando solo 100 muestras dañinas, preservando capacidades generales y reduciendo costes.
El olvido colateral localizado afecta a datos cercanos al desaprender en machine unlearning. Descubre cómo mitigarlo con destilación de profesor local.