Conformal Bayes con Cambio de Etiqueta: Calibración Post-Hoc vs Adaptación
Descubre cómo restaurar la cobertura nominal en Bayes Conformal ante cambios de etiqueta: comparamos calibración post-hoc y adaptación en entrenamiento.
Descubre cómo restaurar la cobertura nominal en Bayes Conformal ante cambios de etiqueta: comparamos calibración post-hoc y adaptación en entrenamiento.
Descubre cómo Visual-TCAV combina mapas de saliencia y atribución de conceptos para explicar predicciones en clasificación de imágenes. Más preciso que TCAV.
Descubre cómo truncar la cola del SVD de actualizaciones reduce sesgos en modelos de IA sin reentrenar, manteniendo precisión. Método post-hoc efectivo.
Analizamos el método MI CAM, que emplea teoría de la información para generar mapas de saliencia en CNNs, logrando explicaciones más precisas y causales.
Mejora la segmentación y profundidad con marginalización de fase en Vision Transformers. Sin entrenamiento, más precisión.
Estudiar la dinámica del entrenamiento, no solo arreglar en postproducción. Descubre cómo predecir, intervenir y diseñar mejores sistemas de IA.
Descubre cómo las redes bayesianas permiten una IA transparente y auditable, superando las limitaciones de las explicaciones post-hoc. Un nuevo marco para la responsabilidad algorítmica.
Evalúa la fidelidad de explicaciones en machine learning con pruebas metamórficas y el conjunto Rashomon. Sin etiquetas reales, selecciona modelos confiables.
Descubre WiserUI-Bench, el benchmark que evalúa si las MLLMs realmente comprenden cómo el diseño UI/UX influye en el comportamiento del usuario a través de pruebas A/B reales.
Los valores e asintóticos tipo Bentkus eliminan el factor faltante, logrando inferencias más precisas y mayores tasas de rechazo en pruebas múltiples.
Descubre CaliDist, un método post-hoc que calibra LLMs midiendo su estabilidad ante distracciones. Reduce el error de calibración un 70%.
Mejora la robustez de agentes de RL en inferencia sin entrenar, usando control predictivo con rollouts adversariales y mitigando problemas fuera de distribución.
Descubre cómo Patcher repara modelos de lenguaje con puertas traseras usando solo un fallo reportado. Defensa práctica contra ataques de entrenamiento.
Descubre ProbRes: aprende volatilidad para pronósticos probabilísticos precisos en series temporales financieras. Mejora calibración de intervalos.
Descubre cómo FMGP mejora la estimación de incertidumbre en redes profundas pre-entrenadas sin sacrificar precisión, escalando a grandes datasets.
Los modelos de recompensa en IA tienen sesgos. La recompensa mecánica los mitiga con pocos datos. Optimiza la alineación de modelos de lenguaje.
Descubre cómo Latent Reward Steering optimiza el razonamiento de LLMs al promover comportamientos cognitivos implícitos.
Descubre cómo los modelos de IA generan razonamientos contradictorios y aparentemente lógicos. Hasta 13% de fallos en modelos comerciales. El Chain-of-Thought no es siempre fiable.
Descubre cómo FGR mejora la calibración de modelos de IA ante cambios de distribución sin necesidad de datos del destino. Aprende a implementarlo.
CSULoRA corrige adaptadores LoRA para evitar que el fine-tuning adversarial dañe la seguridad de los LLMs, preservando la utilidad del modelo. Descubre cómo.