Ataques adversariales entre generaciones de LLMs: seguridad no monotónica
Descubre cómo los ataques adversariales entre generaciones de LLMs Gemma revelan que la seguridad no mejora de forma constante. Gemma 3 es más vulnerable que Gemma 2 y 4.
Descubre cómo los ataques adversariales entre generaciones de LLMs Gemma revelan que la seguridad no mejora de forma constante. Gemma 3 es más vulnerable que Gemma 2 y 4.