#adversario

Robustez de modelos ML en sistemas de detección de intrusiones

Descubre por qué Random Forest (99.98% precisión) cae ante ataques adversarios, mientras CNN mantiene 95.5%. Comparativa de modelos ML para NIDS.

2026-06-11 · 2 min

MemVenom: Envenenamiento Activado de Memorias Multimodales en Agentes Web

Conoce MemVenom: el ataque que envenena la memoria de los agentes web y amenaza la seguridad de la IA multimodal. ¡Descubre cómo protegerse!

2026-06-10 · 2 min

Escuchando lo no dicho: Ataques acústicos con LLM

El ataque Semantic Gambit explota LLMs para aumentar el Word Error Rate al 35.6% en ASR en tiempo real. Conoce esta nueva vulnerabilidad.

2026-06-08 · 1 min

EVA: Adversarios Semánticos Evolutivos para Ataques a Agentes GUI

EVA descubre que el engaño semántico es la clave en ataques a agentes GUI, logrando hasta 85% de éxito en pocas iteraciones. La alineación los hace vulnerables.

2026-06-08 · 1 min

Agentes Adversarios: Ataques de Evasión con Aprendizaje por Refuerzo

Descubre cómo un agente de aprendizaje por refuerzo aprende a atacar modelos de IA con mayor eficacia, aumentando el éxito de ataques de evasión hasta un 13.2%.

2026-06-06 · 2 min

Ataques adversarios en ASR más allá de la forma de onda

Nuevo ataque adversario en ASR evade defensas al perturbar representaciones SSL, mejorando la transferibilidad como en Whisper.

2026-06-06 · 2 min

MaskForge: Ataques Adaptativos con Estructura para Jailbreak de LLMs de Difusión

Aprende cómo MaskForge, un ataque adaptativo de caja negra, alcanza un 79.3% de éxito en jailbreak de dLLMs mediante patrones estructurales dinámicos.

2026-06-04 · 2 min

Degustación de manzanas con dos acciones y costos de cambio

Descubre cómo los investigadores demostraron una cota de arrepentimiento de orden √T para el problema de degustación. ¡Lee el artículo!

2026-06-03 · 2 min

Mejorando la seguridad de las interfaces cerebro-computadora

Modelo ligero de CNN mejora la robustez de interfaces cerebro-computadora ante ataques adversarios. Asegura un despliegue confiable.

2026-06-03 · 2 min

Borrados, no olvidados: backdoors eluden eliminación de conceptos

Descubre cómo los backdoors pueden eludir la eliminación de conceptos en modelos de IA, exponiendo contenido nocivo hasta un 82% de efectividad. ¡Infórmate!

2026-06-02 · 2 min

Efecto del ruido en la generación de lenguaje en el límite

Un solo string ruidoso afecta la generación de lenguaje en IA. Nuevo estudio caracteriza el efecto del ruido en la generación en el límite.

2026-06-02 · 2 min

La Maldición de la Alineación: transferencia de texto potencia ataques de audio

La alineación entre texto y audio en modelos omni permite transferir ataques de jailbreak, aumentando riesgos de seguridad. Descubre cómo.

2026-06-02 · 2 min

Arrepentimiento minimax-óptimo en juegos de Markov parcialmente observables

Algoritmo optimista logra arrepentimiento minimax-óptimo en POMG. Complejidad O(√T) con dependencia de la dimensión de Eluder.

2026-06-02 · 3 min

Control adversario del Valor en Riesgo Condicional mediante inferencia conforme

Controla el CVaR en entornos adversarios sin estacionariedad. Método basado en inferencia conforme garantiza seguridad. Ideal para portafolios y LLMs.

2026-06-02 · 1 min

TabChange: Cambios Precisos de Atributos en Datos Tabulares

Descubre cómo TabChange logra cambios precisos en atributos de datos tabulares, manteniendo la naturalidad y minimizando modificaciones. Ideal para IA y análisis de datos.

2026-06-02 · 2 min

Marco de Red Teaming para Seguridad, Robustez y Equidad en Modelos Médicos de IA

Un marco de red teaming multidominio revela fallos críticos en seguridad y equidad de modelos médicos de IA, ocultos por métricas promedio.

2026-06-02 · 2 min

Agente en navegador de Anthropic: 31.5% de secuestro antes de salvaguardas

Descubre por qué el agente de Anthropic fue secuestrado el 31.5% del tiempo y cómo se comparan OpenAI, Google y Meta en seguridad de prompts.

2026-06-02 · 2 min

Acordes Geométricos Latentes para Ataques Adversarios Eficientes

Descubre cómo los Acordes Geométricos Latentes (LGC) optimizan ataques adversarios con alta fidelidad visual y mínimas perturbaciones. SSIM > 0.99 y LPIPS < 0.01.

2026-06-01 · 2 min

SAEmnesia: eliminación precisa de conceptos en modelos de difusión

Descubre SAEmnesia, un marco que elimina conceptos en modelos de difusión con precisión y eficiencia, reduciendo la búsqueda de hiperparámetros en un 96.67%.

2026-06-01 · 2 min

Detección de odio en video con fusión multimodal razonada

Descubre cómo RAMF mejora la detección de odio en videos con fusión multimodal y razonamiento adversario, superando métodos actuales en 3% y 7%

2026-06-01 · 2 min