Alineados pero frágiles: Mejorando la robustez de seguridad de los LLM mediante optimización de orden cero
<meta name=description content=Descubre cómo la optimización de orden cero ofrece seguridad robusta en sistemas alineados pero frágiles. Estrategias clave para una IA confiable.>