#markov

MCMC sin evaluar el objetivo: enfoque de variable auxiliar

Descubre cómo un nuevo marco unifica y mejora algoritmos MCMC usando variables auxiliares, sin necesidad de evaluar la distribución objetivo. Mejor rendimiento en datos sintéticos y reales.

2026-06-03 · 2 min

Complejidad polinomial de iteración de políticas para MDP robustos L∞

Descubre cómo la iteración de políticas alcanza tiempo polinomial fuerte para MDPs robustos con conjuntos L∞. Un avance clave en optimización secuencial.

2026-06-03 · 2 min

Pruebas secuenciales asintóticamente óptimas con datos markovianos

Descubre un método asintóticamente óptimo para pruebas secuenciales en cadenas de Markov. Mejora límites inferiores y aplicaciones en MCMC y MDPs.

2026-06-03 · 2 min

Modelos de Markov Neuronales Inspeccionables para Series No Estacionarias

Modelos de Markov neuronales inspeccionables mejoran predicción de series no estacionarias. Reducción del 5.6% en discrepancia. ¡Descubre cómo!

2026-06-03 · 2 min

Análisis teórico de Engression y Reverse Markov Engression

Descubre los nuevos límites de convergencia no asintóticos para Engression y Reverse Markov Engression. Resultados casi óptimos para aprendizaje de distribuciones condicionales con redes profundas.

2026-06-02 · 2 min

Identificabilidad en Modelos de Markov con Efectos Instantáneos

Descubre cómo identificar regímenes latentes y estructuras causales en series temporales no estacionarias con modelos de Markov y efectos instantáneos.

2026-06-02 · 3 min

Cómo manejar bandidos contextuales con dinámica de estados latentes

Descubre un enfoque directo para manejar bandidos contextuales con estados latentes. Aprende cómo reducir el problema a bandidos lineales y mejorar las decisiones en entornos inciertos.

2026-06-02 · 2 min

RL continuo seguro con interacción limitada en tratamientos médicos dinámicos

Un nuevo marco de RL continuo seguro optimiza el momento de las interacciones clínicas y garantiza seguridad en toda la trayectoria. ¡Lee el artículo!

2026-06-02 · 2 min

Certificación no vacía de Transport MCMC con flujos normalizadores

Certificación no vacía de MCMC de transporte: nuevos límites de brecha espectral con flujos normalizadores. Ideal para muestreo bayesiano.

2026-06-02 · 2 min

Estructura y Escala en Modelado de Secuencias Simpliciales

¿Cómo se relacionan las leyes de escalado con las representaciones internas en deep learning? Este estudio revela una correlación entre rendimiento y estructura

2026-06-02 · 1 min

Gráfico contrastivo anclado en Doeblin para aprender kernels de Markov

Aprende a estimar núcleos de Markov válidos con un gráfico contrastivo anclado en Doeblin. Mejora la precisión en dinámicas de cadena.

2026-06-02 · 1 min

Arrepentimiento minimax-óptimo en juegos de Markov parcialmente observables

Algoritmo optimista logra arrepentimiento minimax-óptimo en POMG. Complejidad O(√T) con dependencia de la dimensión de Eluder.

2026-06-02 · 3 min

Blindaje Robusto para Aprendizaje por Refuerzo Seguro

Descubre el blindaje robusto para RL seguro. Garantiza seguridad en MDPs con transiciones inciertas mediante lógica temporal. Ideal para alta incertidumbre.

2026-06-02 · 2 min

Comportamiento de Teoría de Prospectos en MDPs con Estados Catastróficos

Descubre cómo la optimalidad de Bellman en MDPs con estados catastróficos produce aversión a pérdidas y efecto reflejo, sin preferencias de riesgo.

2026-06-02 · 4 min

PatenteXAI: Atribución Shapley jerárquica para valoración de patentes

Aprende cómo PatenteXAI aplica Shapley jerárquico y grafos de conocimiento para valorar patentes de forma eficiente, con resultados precisos en milisegundos. Optimiza tu portafolio.

2026-06-02 · 2 min

Descubrimiento Causal Federado con Intervenciones Desconocidas

Descubre I-PERI, un algoritmo federado que recupera estructuras causales a partir de datos heterogéneos con intervenciones desconocidas, mejorando privacidad y precisión.

2026-06-01 · 2 min

Desafíos del aprendizaje por refuerzo en sistemas energéticos industriales

Analizamos los desafíos del RL en sistemas energéticos reales: observabilidad, diseño de acciones, recompensa y la brecha simulación-realidad.

2026-06-01 · 2 min

Convergencia de aproximaciones bi-escala markovianas en RL

Descubre cómo se demuestra la convergencia de algoritmos bi-escala bajo ruido markoviano, un avance clave para el aprendizaje por refuerzo off-policy.

2026-06-01 · 2 min

Convergencia no asintótica de algoritmos estocásticos: marco de Lyapunov

Descubre cómo las funciones de Lyapunov permiten analizar la convergencia finita de algoritmos estocásticos en aprendizaje automático y refuerzo.

2026-06-01 · 2 min

Caminata verdadera auto-evitativa para acelerar integración MCMC

Descubre cómo la caminata verdadera auto-evitativa reduce el error de estimación integral en MCMC de t^-1/2 a O(√log t/t), acelerando la convergencia.

2026-06-01 · 2 min