EVA: Adversarios Semánticos Evolutivos para Ataques a Agentes GUI
EVA descubre que el engaño semántico es la clave en ataques a agentes GUI, logrando hasta 85% de éxito en pocas iteraciones. La alineación los hace vulnerables.
EVA descubre que el engaño semántico es la clave en ataques a agentes GUI, logrando hasta 85% de éxito en pocas iteraciones. La alineación los hace vulnerables.
Descubre cómo un agente de aprendizaje por refuerzo aprende a atacar modelos de IA con mayor eficacia, aumentando el éxito de ataques de evasión hasta un 13.2%.
Nuevo ataque adversario en ASR evade defensas al perturbar representaciones SSL, mejorando la transferibilidad como en Whisper.
Modelo ligero de CNN mejora la robustez de interfaces cerebro-computadora ante ataques adversarios. Asegura un despliegue confiable.
La alineación entre texto y audio en modelos omni permite transferir ataques de jailbreak, aumentando riesgos de seguridad. Descubre cómo.
Algoritmo optimista logra arrepentimiento minimax-óptimo en POMG. Complejidad O(√T) con dependencia de la dimensión de Eluder.
Un marco de red teaming multidominio revela fallos críticos en seguridad y equidad de modelos médicos de IA, ocultos por métricas promedio.
Descubre por qué el agente de Anthropic fue secuestrado el 31.5% del tiempo y cómo se comparan OpenAI, Google y Meta en seguridad de prompts.
Descubre cómo los Acordes Geométricos Latentes (LGC) optimizan ataques adversarios con alta fidelidad visual y mínimas perturbaciones. SSIM > 0.99 y LPIPS < 0.01.
Descubre SAEmnesia, un marco que elimina conceptos en modelos de difusión con precisión y eficiencia, reduciendo la búsqueda de hiperparámetros en un 96.67%.