Robustez post-hoc para aprendizaje por refuerzo basado en modelos
Mejora la robustez de agentes de RL en inferencia sin entrenar, usando control predictivo con rollouts adversariales y mitigando problemas fuera de distribución.
Mejora la robustez de agentes de RL en inferencia sin entrenar, usando control predictivo con rollouts adversariales y mitigando problemas fuera de distribución.
Nuevo ataque IHO vulnera LLMs incluso con defensas avanzadas. Evalúa robustez adversarial de forma eficiente y transferible. ¡Descúbrelo!
Descubre cómo la sensibilidad de clasificadores es un arma de doble filo, y cómo HPM equilibra discriminabilidad y robustez adversarial. ¡Lee más!
Aprende cómo un marco Bayesiano unificador permite defensas proactivas y reactivas contra ataques adversariales, mejorando la seguridad de la IA.
Descubre nuevo método de fine-tuning adversarial para CLIP calibra la incertidumbre y mejora robustez sin perder precisión en clasificación zero-shot.
Un preprocesador simple combina ruido gaussiano y filtro bilateral para lograr robustez adversarial supralineal en CNNs con bajo costo computacional.
Descubre cómo las fronteras de Pareto y la optimización automatizada revelan rendimientos superiores en entrenamiento certificado.
Descubre CEAR: mejora la robustez adversarial certificada en DNNs usando ensambles con ruido y votación. Superior en MNIST, CIFAR10 y TinyImageNet.
Descubre TASER, un método de regularización que mejora la robustez adversarial sin degradar la precisión. Basado en operadores Stein, ideal para deep learning.
Robustez adversarial cuántica en IA: cómo la computación cuántica protege modelos de aprendizaje automático de ataques adversarios.
Robustez adversarial en atribución: la regularización implícita protege modelos contra ataques. Descubre su impacto en la seguridad.
Robustez generalizable para defensa causal certificada. Estrategias avanzadas que mejoran la seguridad y fiabilidad de modelos de IA.