#robustez

LIBERO-Occ: Evaluación y mejora de modelos VLA bajo oclusión escénica

Los modelos VLA se degradan con oclusión. LIBERO-Occ los evalúa y propone Imaginación de Perspectiva (VIM) para mejorar. ¡Conoce el benchmark!

2026-06-10 · 2 min

Marco de aumentación en inferencia para detección de FA en PPG

Descubre cómo el marco ITA mejora la detección de fibrilación auricular en señales PPG sin reentrenar, aumentando AUROC hasta 8.5%. Ideal para despliegue real.

2026-06-10 · 2 min

Robustez de tareas mediante reetiquetado de datos robóticos visión-acción

TREAD usa VLMs para reetiquetar datos robóticos y mejorar robustez en tareas nuevas. Aumenta la generalización de tu robot.

2026-06-10 · 2 min

EEVEE: Aprendizaje de prompts en tiempo de prueba para agentes automejorables

Descubre EEVEE, marco de aprendizaje de prompts en tiempo de prueba para agentes LLM que maneja múltiples datasets y mejora el rendimiento hasta un 48%

2026-06-10 · 2 min

Robustez de grafos contra ataques backdoor: perspectiva de sobresimilitud

Descubre cómo SimGuard protege redes de grafos contra ataques backdoor usando sobresimilitud. Mejora la robustez sin sacrificar rendimiento.

2026-06-10 · 2 min

Usuarios impacientes confunden agentes de IA: simulaciones de rasgos humanos para pruebas

TraitBasis simula rasgos humanos (impaciencia, incoherencia) para estresar agentes de IA. ¿Son frágiles? Descubre la degradación de rendimiento de hasta 30% en τ-Trait.

2026-06-10 · 3 min

Perdidos en la serialización: Invarianza y generalización de razonadores de grafos LLM

Descubre cómo la serialización afecta la invarianza y generalización de los LLM al razonar sobre grafos. Analizamos la robustez ante cambios en etiquetado y estructura.

2026-06-10 · 3 min

Muestreo de Punto Más Lejano Guiado por Gradiente para Selección Robusta

GGFPS: muestreo guiado por gradiente para seleccionar conjuntos de entrenamiento. Reduce costos hasta un 50% y mejora la robustez de modelos de ML en química.

2026-06-10 · 3 min

Cuando RL falla tras SFT: rejuveneciendo la plasticidad del modelo

Descubre cómo el sobreentrenamiento en SFT reduce la plasticidad del modelo y cómo el método Rejuvenation restaura la capacidad de aprendizaje por refuerzo para mejorar el rendimiento.

2026-06-10 · 1 min

Optimización con restricciones para predicción robusta de estabilidad proteica

Nuevo método optimiza predicción de estabilidad proteica sin cambiar arquitectura y logra mayor robustez en datos fuera de distribución.

2026-06-09 · 1 min

DynaCF: Mitigando el Aprendizaje por Atajos en Modelos de Recompensa

DynaCF reduce el aprendizaje superficial en modelos de recompensa mediante reajuste dinámico con contrafácticos, mejorando robustez y calidad de preferencias.

2026-06-09 · 1 min

De atajos a razonamiento: post-entrenamiento robusto de ToM con RL

El nuevo enfoque Thinking-RFT supera atajos en ToM: mejora un 6% frente a SFT mediante razonamiento y refuerzo.

2026-06-09 · 2 min

Emparejamiento Robusto de Grafos Aleatorios con AMP

Descubre un nuevo algoritmo AMP que logra emparejamiento robusto de grafos aleatorios densos incluso bajo perturbaciones adversariales de gran tamaño. Ideal para ciberseguridad y análisis de redes.

2026-06-09 · 2 min

LARP: Prefiltrado Robusto de Datos Agnóstico al Aprendiz

LARP ofrece prefiltrado robusto de datos para múltiples algoritmos. Conoce su coste de rendimiento y cómo protege tus modelos de datos contaminados.

2026-06-09 · 2 min

Inferencia Conformal Localmente Adaptativa para Modelos de Operadores

Descubre LSCI, un marco libre de distribución para generar conjuntos de predicción adaptativos y calibrados para modelos de operadores en pronósticos espacio-temporales.

2026-06-09 · 2 min

DHAuDS: Benchmark dinámico y heterogéneo para adaptación en pruebas

DHAuDS es un benchmark de audio dinámico y heterogéneo que expone las debilidades reales de los modelos TTA frente a ruido realista. Ideal para investigadores.

2026-06-09 · 2 min

Enmascaramiento Espacial por Energía: Robustez e Interpretabilidad en Visión

Descubre cómo ERSM mejora la robustez e interpretabilidad de modelos de visión al reducir redundancias y aislar objetos.

2026-06-09 · 2 min

Formulaciones cónicas de métricas de transporte para redes e hiperredes

Explora las nuevas formulaciones cónicas de métricas de transporte para redes e hiperredes no balanceadas, con algoritmo eficiente y propiedades de robustez.

2026-06-09 · 2 min

¿Están realmente correlacionadas la robustez de clasificación y explicación?

Estudio revela que robustez de clasificación y explicación no están correlacionadas. Nuevo método de entrenamiento modifica paisaje de pérdida sin afectar clasificación.

2026-06-09 · 2 min

AT-DPT: Aprendizaje por refuerzo robusto en contexto contra envenenamiento

Descubre cómo AT-DPT mejora la robustez del aprendizaje por refuerzo en contexto frente a ataques de envenenamiento de recompensas. Resultados sorprendentes.

2026-06-09 · 1 min