#adversarios

EVA: Adversarios Semánticos Evolutivos para Ataques a Agentes GUI

EVA descubre que el engaño semántico es la clave en ataques a agentes GUI, logrando hasta 85% de éxito en pocas iteraciones. La alineación los hace vulnerables.

2026-06-08 · 1 min

Agentes Adversarios: Ataques de Evasión con Aprendizaje por Refuerzo

Descubre cómo un agente de aprendizaje por refuerzo aprende a atacar modelos de IA con mayor eficacia, aumentando el éxito de ataques de evasión hasta un 13.2%.

2026-06-06 · 2 min

Ataques adversarios en ASR más allá de la forma de onda

Nuevo ataque adversario en ASR evade defensas al perturbar representaciones SSL, mejorando la transferibilidad como en Whisper.

2026-06-06 · 2 min

Mejorando la seguridad de las interfaces cerebro-computadora

Modelo ligero de CNN mejora la robustez de interfaces cerebro-computadora ante ataques adversarios. Asegura un despliegue confiable.

2026-06-03 · 2 min

La Maldición de la Alineación: transferencia de texto potencia ataques de audio

La alineación entre texto y audio en modelos omni permite transferir ataques de jailbreak, aumentando riesgos de seguridad. Descubre cómo.

2026-06-02 · 2 min

Arrepentimiento minimax-óptimo en juegos de Markov parcialmente observables

Algoritmo optimista logra arrepentimiento minimax-óptimo en POMG. Complejidad O(√T) con dependencia de la dimensión de Eluder.

2026-06-02 · 3 min

Marco de Red Teaming para Seguridad, Robustez y Equidad en Modelos Médicos de IA

Un marco de red teaming multidominio revela fallos críticos en seguridad y equidad de modelos médicos de IA, ocultos por métricas promedio.

2026-06-02 · 2 min

Agente en navegador de Anthropic: 31.5% de secuestro antes de salvaguardas

Descubre por qué el agente de Anthropic fue secuestrado el 31.5% del tiempo y cómo se comparan OpenAI, Google y Meta en seguridad de prompts.

2026-06-02 · 2 min

Acordes Geométricos Latentes para Ataques Adversarios Eficientes

Descubre cómo los Acordes Geométricos Latentes (LGC) optimizan ataques adversarios con alta fidelidad visual y mínimas perturbaciones. SSIM > 0.99 y LPIPS < 0.01.

2026-06-01 · 2 min

SAEmnesia: eliminación precisa de conceptos en modelos de difusión

Descubre SAEmnesia, un marco que elimina conceptos en modelos de difusión con precisión y eficiencia, reduciendo la búsqueda de hiperparámetros en un 96.67%.

2026-06-01 · 2 min