Desactivando el desencadenante: Defensa Plug-and-Play para LLMs con puerta trasera mediante Suavizado Geométrico Intrínseco de Riesgo de Cola
Aprende sobre la defensa plug-and-play contra puertas traseras en LLMs usando suavizado geométrico. Una solución eficaz y fácil de implementar para proteger modelos de lenguaje.