PECKER: Borrado eficiente de conocimiento en modelos de difusión
PECKER: método eficiente de desaprendizaje para modelos de difusión. Reduce el tiempo de entrenamiento y mejora el borrado selectivo de conocimiento.
PECKER: método eficiente de desaprendizaje para modelos de difusión. Reduce el tiempo de entrenamiento y mejora el borrado selectivo de conocimiento.
Nuevas cotas de generalización para algoritmos Monte Carlo en el régimen de interpolación, con resultados en MNIST, CIFAR-10 y SVHN.
GUDA: atribución grupal contrafactual eficiente para modelos de difusión. Usa desaprendizaje y es 100x más rápido que reentrenar con cada grupo eliminado.
Descubre cómo DASH comprime modelos de difusión manteniendo calidad y guía, superando al entrenamiento desde cero.
La capacidad del estudiante modera la destilación de conocimiento. Estudio en ResNet con CIFAR-10 muestra que Feature-KD supera a Logit-KD en ciertos casos.
El olvido colateral localizado afecta a datos cercanos al desaprender en machine unlearning. Descubre cómo mitigarlo con destilación de profesor local.
Descubre TASER, un método de regularización que mejora la robustez adversarial sin degradar la precisión. Basado en operadores Stein, ideal para deep learning.