DOG-DPO: Optimización Geométrica Dinámica para Seguridad
DOG-DPO seleccionando solo el 11% de los datos logra una alineación de seguridad superior en LLMs sin entrenamiento adicional. Descubre cómo.
DOG-DPO seleccionando solo el 11% de los datos logra una alineación de seguridad superior en LLMs sin entrenamiento adicional. Descubre cómo.