Reconstrucción de imágenes memorizadas a partir de prompts naturales
Un nuevo ataque de bajo costo reconstruye imágenes privadas con prompts naturales. Descubre la vulnerabilidad en modelos de IA.
Un nuevo ataque de bajo costo reconstruye imágenes privadas con prompts naturales. Descubre la vulnerabilidad en modelos de IA.
¿Por qué el aprendizaje en contexto falla con datos estructurados? El bloqueo de prior categórico limita a los LLMs. Descubre alternativas como LoRA.
Nuevo estudio analiza la memorización en agentes de IA: el resumen reduce extracción un 76%, pero la eliminación deja residuos. Conoce el equilibrio entre personalización y riesgo.
DiRL: marco de RL que distingue razonamiento de memorización en LLMs, mejorando exploración y resultados en benchmarks.
Descubre cómo los canarios sintéticos mejoran la auditoría de privacidad en LLMs. Aprende a medir memorización y fuga de datos en fine-tuning eficiente.
Aprende cómo el índice ICR permite evaluar representaciones y generación en modelos de difusión, detectando memorización temprana sin datos externos.
Ataques de reconstrucción en datos sintéticos: riesgos de privacidad. Estudio de 14 ataques y 9 métodos, ganador del NIST CRC.
Hipótesis de Influencia Reflejada: estima influencia de datos en modelos de IA usando pases hacia adelante. Ideal para atribución, detección de fugas y más.
Estudiar la dinámica del entrenamiento, no solo arreglar en postproducción. Descubre cómo predecir, intervenir y diseñar mejores sistemas de IA.
Descubre cómo los modelos de difusión generalizan con representaciones equilibradas. Detecta memorización y edita sin entrenamiento.
¿Los LLMs filtran datos de entrenamiento? Este estudio revela la diferencia entre capacidad y propensión, mostrando que los modelos rara vez revelan datos en escenarios no adversariales.
Descubre cómo la Máquina Neural de Langevin usa reglas locales asimétricas para generar imágenes creativas y eliminar ruido, con aplicaciones biológicas.
Reduce correlaciones espurias con un método de dos etapas basado en memorización. Solo 10% de datos, un modelo ERM supera a técnicas de debiasing ¡Descúbrelo!
Descubre un nuevo enfoque causal para evaluar ataques de inferencia de membresía sin reentrenar, reduciendo sesgos. ¡Ideal para LLMs!
Descubre cómo la información previa determina si la memorización en modelos lineales es beneficiosa o perjudicial, según el umbral de ruido.
Descubre qué tipo de fuga de datos es más peligrosa. Un estudio masivo en 2,047 datasets revela que la fuga por selección infla los resultados hasta un 90%.
GUARD: mitigación quirúrgica de memorización en difusión texto-imagen sin sacrificar calidad. Protege privacidad y evita infracciones de copyright.
Los LLM fallan en corregir el 65% de sus errores de anotación. Nuevo estudio revela el impacto de los priores internos y el métrico DSF para medir alineación.
Descubre cómo actualizar el modelo de neurona estándar en redes neuronales artificiales con un enfoque cortical realista que mejora expresividad, robustez y velocidad de aprendizaje.
El framework NumLeak expone cómo los modelos de IA memorizan datos de benchmarks públicos. Una amenaza para la evaluación y la seguridad.