#delos

Cuantificación de incertidumbre en estructuras con PCE y aprendizaje activo

Mejora la precisión de modelos sustitutos en ingeniería con expansión en caos polinomial y aprendizaje activo multivariante. Reduce costos computacionales.

2026-06-17 · 2 min

Repensando los grupos en RLVR sin crítico

Descubre cómo eliminar la necesidad de grupos en RLVR sin crítico usando filtrado de tokens negativos, logrando entrenamiento estable con un solo rollout.

2026-06-17 · 2 min

Operator Boosting produce sustitutos Pareto-eficientes de PDE

Operator Boosting reduce parámetros hasta un 95% y mejora la precisión en sustitutos neuronales de PDE. Optimiza FNO, DeepONet y CNO con aprendizaje residual.

2026-06-17 · 2 min

CheckMIABench: Bases firmes para ataques de inferencia de membresía en LLMs

Descubre CheckMIABench, el nuevo benchmark para evaluar ataques de inferencia de membresía en LLMs. Mejora la privacidad de tus modelos con bases sólidas.

2026-06-17 · 2 min

Refinando estados ocultos para razonamiento fiable en LLMs

Descubre ReLAR: marco que refina estados ocultos de LLMs con aprendizaje por refuerzo, mejorando precisión y estabilidad sin cadenas de pensamiento.

2026-06-17 · 2 min

MGUP: Política de Actualización con Alineación Gradiente-Momentum

Descubre MGUP, un nuevo mecanismo de actualización selectiva que acelera y estabiliza el entrenamiento de modelos de IA. Integrable con AdamW, Lion y Muon.

2026-06-17 · 2 min

Cuando los modelos dinámicos leen los pasos de tiempo incorrectos

Descubre cómo CREST corrige la dilución temporal en modelos dinámicos, reanclando crédito de eventos sin etiquetas para lecturas globales robustas.

2026-06-17 · 2 min

EnvRL: Aprende de las dinámicas del entorno en RL agéntico

Mejora el éxito de agentes LLM con EnvRL al aprender dinámicas del entorno. Resultados: +10% en ALFWorld y WebShop.

2026-06-17 · 1 min

Recuperación Ciega de Dominios Latentes mediante Descubrimiento de Simetrías

Descubre cómo recuperar dominios y señales ocultas de datos corruptos sin supervisión, usando simetrías. Nuevo método para problemas inversos ciegos.

2026-06-17 · 1 min

Auto-mejora continua con memorias latentes ligeras de experiencia

Descubre cómo los LLMs mejoran sin supervisión usando memorias latentes ligeras, superando al reentrenamiento completo. ¡Optimización eficiente!

2026-06-17 · 2 min

Meta-clasificación de modelos OCC con correlación de ranking y vecino cercano

Aprende a clasificar modelos OCC con correlación de ranking y vecino cercano. Alta precisión en datasets y algoritmos. Código público.

2026-06-17 · 2 min

AIMER: poda de expertos libre de calibración para modelos MoE

AIMER es un método sin calibración para podar expertos en modelos MoE, reduciendo memoria y costos. Logra balance de capacidad en tareas, solo 0.22s.

2026-06-17 · 3 min

Modelado de uplift bajo sesgos estructurales: estabilidad de métricas y robustez

Descubre cómo los sesgos estructurales impactan la evaluación de modelos de uplift. TARNet se destaca por su robustez. Aprende sobre métricas estables y ATE.

2026-06-17 · 2 min

Moderación de promoción ilícita en juegos UGC con modelos de visión-lenguaje

Descubre cómo los modelos de visión-lenguaje identifican promociones ilícitas de juegos inseguros para menores. UGCG-Guard logra un 94% de precisión.

2026-06-17 · 2 min

Aprendizaje Recursivo Sin Colapso: Estabilización por Pesos

Descubre cómo un marco de estabilización basado en pesos evita el colapso en modelos generativos recursivos. El peso óptimo para datos reales es el inverso del

2026-06-17 · 2 min

Perspectiva de sistemas dinámicos para redes neuronales

Descubre cómo los sistemas dinámicos explican el comportamiento de redes neuronales: propagación, entrenamiento, estabilidad y límites de campo medio.

2026-06-17 · 3 min

Modelos de supervivencia con retrasos de notificación censurados por la derecha

Mejora la evaluación de riesgos con modelos de supervivencia que manejan retrasos censurados. Descubre nuestro método con aprendizaje por transferencia.

2026-06-17 · 3 min

Coordinación tácita de grandes modelos de lenguaje

Descubre cómo los LLMs logran coordinarse sin hablar, superando a humanos en ciertos escenarios, pero fallando en tareas numéricas y culturales. Estudio

2026-06-17 · 2 min

¿Pueden los modelos fundacionales de visión navegar? Evaluación real y lecciones

Evaluación cero-shot de cinco modelos de navegación visual en entornos reales. Fallos en colisiones, reconocimiento y robustez. ¡Lee las lecciones!

2026-06-17 · 1 min

Efectos individualizados del tratamiento en ictus isquémico agudo con TRAM-DAG

Descubre cómo el modelo TRAM-DAG estima el beneficio individual de la trombectomía en ictus, validado con ensayos clínicos. Personalización del tratamiento

2026-06-17 · 1 min