LIBERO-Occ: Evaluación y mejora de modelos VLA bajo oclusión escénica
Los modelos VLA se degradan con oclusión. LIBERO-Occ los evalúa y propone Imaginación de Perspectiva (VIM) para mejorar. ¡Conoce el benchmark!
Los modelos VLA se degradan con oclusión. LIBERO-Occ los evalúa y propone Imaginación de Perspectiva (VIM) para mejorar. ¡Conoce el benchmark!
Descubre cómo el marco ITA mejora la detección de fibrilación auricular en señales PPG sin reentrenar, aumentando AUROC hasta 8.5%. Ideal para despliegue real.
TREAD usa VLMs para reetiquetar datos robóticos y mejorar robustez en tareas nuevas. Aumenta la generalización de tu robot.
Descubre EEVEE, marco de aprendizaje de prompts en tiempo de prueba para agentes LLM que maneja múltiples datasets y mejora el rendimiento hasta un 48%
Descubre cómo SimGuard protege redes de grafos contra ataques backdoor usando sobresimilitud. Mejora la robustez sin sacrificar rendimiento.
TraitBasis simula rasgos humanos (impaciencia, incoherencia) para estresar agentes de IA. ¿Son frágiles? Descubre la degradación de rendimiento de hasta 30% en τ-Trait.
Descubre cómo la serialización afecta la invarianza y generalización de los LLM al razonar sobre grafos. Analizamos la robustez ante cambios en etiquetado y estructura.
GGFPS: muestreo guiado por gradiente para seleccionar conjuntos de entrenamiento. Reduce costos hasta un 50% y mejora la robustez de modelos de ML en química.
Descubre cómo el sobreentrenamiento en SFT reduce la plasticidad del modelo y cómo el método Rejuvenation restaura la capacidad de aprendizaje por refuerzo para mejorar el rendimiento.
Nuevo método optimiza predicción de estabilidad proteica sin cambiar arquitectura y logra mayor robustez en datos fuera de distribución.
DynaCF reduce el aprendizaje superficial en modelos de recompensa mediante reajuste dinámico con contrafácticos, mejorando robustez y calidad de preferencias.
El nuevo enfoque Thinking-RFT supera atajos en ToM: mejora un 6% frente a SFT mediante razonamiento y refuerzo.
Descubre un nuevo algoritmo AMP que logra emparejamiento robusto de grafos aleatorios densos incluso bajo perturbaciones adversariales de gran tamaño. Ideal para ciberseguridad y análisis de redes.
LARP ofrece prefiltrado robusto de datos para múltiples algoritmos. Conoce su coste de rendimiento y cómo protege tus modelos de datos contaminados.
Descubre LSCI, un marco libre de distribución para generar conjuntos de predicción adaptativos y calibrados para modelos de operadores en pronósticos espacio-temporales.
DHAuDS es un benchmark de audio dinámico y heterogéneo que expone las debilidades reales de los modelos TTA frente a ruido realista. Ideal para investigadores.
Descubre cómo ERSM mejora la robustez e interpretabilidad de modelos de visión al reducir redundancias y aislar objetos.
Explora las nuevas formulaciones cónicas de métricas de transporte para redes e hiperredes no balanceadas, con algoritmo eficiente y propiedades de robustez.
Estudio revela que robustez de clasificación y explicación no están correlacionadas. Nuevo método de entrenamiento modifica paisaje de pérdida sin afectar clasificación.
Descubre cómo AT-DPT mejora la robustez del aprendizaje por refuerzo en contexto frente a ataques de envenenamiento de recompensas. Resultados sorprendentes.