#datos de preferencias

DOG-DPO: Optimización Geométrica Dinámica para Seguridad

DOG-DPO seleccionando solo el 11% de los datos logra una alineación de seguridad superior en LLMs sin entrenamiento adicional. Descubre cómo.