#tat · DeepCodeNews

MADPO: Optimización Adaptativa de Preferencias por Márgenes

Descubre MADPO, un método que utiliza un modelo de recompensa para ajustar dinámicamente el aprendizaje en la optimización de preferencias, superando las limitaciones de DPO.

2026-06-02 · 1 min

Convergencia de métodos de gradiente estocástico bajo ruido de cola pesada

Descubre cómo SGD y SMD convergen en expectativa bajo ruido de cola pesada sin modificaciones. Nuevos resultados revelan su potencial.

2026-06-02 · 2 min

Meta-Optimización con Ensambles Adaptativos para Equilibrio Robustez-Precisión

AdaE-SAEA: algoritmo evolutivo con ensambles adaptativos y RL para equilibrar robustez y precisión. Mejora rendimiento en problemas reales.

2026-06-02 · 2 min

Recocido Autorregulado en Modelos de Difusión de Cola Pesada

Aprende cómo el recocido autorregulado en modelos de difusión de cola pesada mejora el muestreo adaptativo. Optimiza la generación con SDE.

2026-06-02 · 2 min

Minimización adaptativa de nitidez con paso Polyak: planificador teórico

Descubre cómo el algoritmo SAM con paso Polyak mejora la generalización y reduce el ajuste de hiperparámetros, con garantías de convergencia teórica.

2026-06-02 · 2 min

Recuperación exacta de comunidades en SBM con consultas limitadas

Descubre cómo las consultas adaptativas superan el límite de consultas uniformes para recuperar comunidades exactamente.

2026-06-02 · 2 min

Residuales PINN para refinamiento adaptativo de malla en EDP

Los residuales de redes informadas por física guían el refinamiento adaptativo de malla en solucionadores de EDP, reduciendo errores con menos grados de libertad. ¡Descubre cómo!

2026-06-02 · 2 min

ProtoAda: Expansión Adaptativa Guiada por Prototipos para Ajuste Continuo

ProtoAda usa prototipos y consolidación geométrica para evitar interferencias en ajuste continuo multimodal, mejorando rendimiento.

2026-06-02 · 2 min

NestRL: Régimen de entrenamiento anidado para equipo humano-IA

NestRL optimiza la colaboración humano-IA mediante entrenamiento anidado, logrando mayor adaptabilidad y rendimiento frente a métodos tradicionales en Overcooked.

2026-06-02 · 2 min

Evaluación de disparidades raciales en gastos sanitarios mediante mediadores

Descubre cómo el machine learning descompone las disparidades raciales en gastos sanitarios, identificando el impacto de mediadores como nivel socioeconómico y acceso a seguros.

2026-06-02 · 2 min

Selección Adaptativa de Ventanas para la Predicción de Riesgos Financieros

Aprende sobre BAWS: un algoritmo adaptativo que elige la ventana de datos ideal para pronosticar riesgos financieros como VaR y ES, superando métodos tradicionales.

2026-06-02 · 2 min

AdaGrad++ y Adam++: métodos adaptativos simples sin parámetros

Descubre AdaGrad++ y Adam++: algoritmos adaptativos sin parámetros que ofrecen convergencia garantizada. Optimiza deep learning sin ajustes manuales.

2026-06-02 · 2 min

Sensado comprimido adaptativo: estimación eficiente del eigenvector principal

Nuevo análisis muestra que el sensado adaptativo comprimido alcanza convergencia global con solo dos medidas por iteración, revelando límites insuperables frente a métodos no adaptativos.

2026-06-02 · 2 min

Optimización Adaptativa Humana para Pronósticos de Series Temporales

Optimiza pronósticos de series temporales con correcciones adaptativas y humanos en el bucle. Mejora precisión sin reentrenar, usando IA.

2026-06-02 · 2 min

AdaptiveK: Autoencoders Dispersos por Complejidad

AdaptiveK ajusta dinámicamente la esparcidad según la complejidad semántica, mejorando interpretabilidad y reconstrucción de modelos de lenguaje.

2026-06-02 · 2 min

Regularización óptima para aprendizaje performativo

Descubre cómo la regularización óptima reduce el riesgo en aprendizaje performativo, beneficiándose incluso en regímenes sobreparametrizados. Clave para IA robusta.

2026-06-02 · 2 min

DuetServe: Prefill y decode en LLM con multiplexación adaptativa de GPU

DuetServe armoniza prefill y decode en LLMs con multiplexación adaptativa de GPU. Mejora el throughput 1.3x manteniendo baja latencia. Descúbrelo.

2026-06-02 · 2 min

WUSH: Transformaciones Adaptativas Casi Óptimas para Cuantización de LLM

WUSH mejora la cuantización de LLMs hasta +2.8 puntos en W4A4. Transformaciones adaptativas casi óptimas para despliegue eficiente en GPU.

2026-06-02 · 1 min

Redes Echo State en series temporales: ajuste de hiperparámetros y comparación

Descubre cómo las ESN se comparan con ARIMA y ETS en pronóstico de series temporales. Análisis de hiperparámetros y benchmark M4.

2026-06-02 · 2 min

Exploración adaptativa para bandidos con estado latente

Descubre cómo los algoritmos adaptativos mejoran la exploración en bandidos con estado latente, reduciendo el arrepentimiento dinámico mediante resúmenes y pruebas de actualización.

2026-06-02 · 1 min