De la dinámica de parámetros a la puntuación de riesgo: cuantificación de la degradación de la seguridad a nivel de muestra en el ajuste fino de LLM
<meta name=description content=Analizamos cómo el ajuste fino de modelos de lenguaje (LLM) reduce su seguridad por muestra, cuantificando la degradación y sus implicaciones para la confiabilidad.>