Inofensivo pero Dañino: Ataques de Indicaciones Neutrales para la Dirección Sigilosa de Alucinaciones en Habilidades de Agentes
Indicaciones neutrales: el ataque sigiloso que provoca alucinaciones en agentes de IA. Conoce sus riesgos y cómo proteger tus modelos.