#estocástica

Aprendizaje profundo bilevel para control óptimo de obstáculos

Método S2-FOBA: aprendizaje profundo bilevel de un solo bucle para control óptimo de obstáculos. Eficiente, sin malla y escalable a dominios complejos.

2026-06-03 · 2 min

Rex: Familia de solvers Runge-Kutta exponenciales reversibles

Descubre Rex: solvers reversibles para ODE/SDE con precisión casi de máquina en generación y edición de imágenes.

2026-06-03 · 1 min

Guía del autoestopista: estimación de gradientes Poisson

Descubre cómo estimar gradientes Poisson sin sesgo con el método EAT modificado. Comparativa con Gumbel-Softmax para VAEs y modelos de inferencia neuronal.

2026-06-03 · 2 min

Modelos de Markov Neuronales Inspeccionables para Series No Estacionarias

Modelos de Markov neuronales inspeccionables mejoran predicción de series no estacionarias. Reducción del 5.6% en discrepancia. ¡Descubre cómo!

2026-06-03 · 2 min

Cómo ampliar el aprendizaje centrado en decisiones con estimación de gradiente

Nuevo método basado en función de puntuación amplía el aprendizaje centrado en decisiones a problemas con incertidumbre en restricciones.

2026-06-03 · 2 min

Optimización estocástica riemanniana para reducción suficiente de dimensión

Aprende cómo SMAVE optimiza la reducción de dimensionalidad con gradiente riemanniano estocástico, superando a RMAVE en velocidad y precisión.

2026-06-02 · 3 min

Límites de error para un estimador de deriva basado en modelos de difusión

Analizamos las cotas de error teóricas de un estimador de deriva basado en modelos de difusión, descomponiendo el riesgo en discretización, aproximación de score, inicialización y varianza.

2026-06-02 · 2 min

Precisión de la aproximación gaussiana en iteraciones de SA

Descubre cómo una gaussiana aproxima iteraciones de SA con cotas de error explícitas y tasas de convergencia óptimas, validado con simulaciones.

2026-06-02 · 2 min

Inferencia de heterogeneidad en partículas con Langevin de segundo orden

Aprende cómo un enfoque de máxima verosimilitud permite inferir heterogeneidad poblacional y modelos dinámicos desde trayectorias estocásticas de partículas.

2026-06-02 · 2 min

Ajuste dinámico de entropía en control de drones con RL

El ajuste dinámico de entropía en RL mejora el control de drones, evitando olvido catastrófico y optimizando la exploración. Comparativa SAC vs TD3.

2026-06-02 · 1 min

Preferencia paradójica por el ruido en RNN

Descubre por qué las RNN entrenadas con ruido funcionan mejor con ese mismo ruido. Un análisis sorprendente de la dinámica estocástica.

2026-06-02 · 1 min

CRMA: Backbone con límite espectral para ajuste fino continuo de LLMs

Descubre CRMA: ajuste fino secuencial de LLMs sin olvido catastrófico, mejorando rendimiento en tareas previas. Sin buffers, sin destilación.

2026-06-02 · 2 min

Mapas de Flujo Estocásticos Fuertes

Descubre cómo los Strong Stochastic Flow Maps revolucionan el muestreo en modelos de difusión, permitiendo generar imágenes y simular sistemas moleculares en pocos pasos.

2026-06-02 · 2 min

Límites inferiores teóricos para optimización estocástica con bits limitados

Descubre cómo los límites informacionales afectan la optimización estocástica con gradientes de baja precisión: reducción a estimación gaussiana.

2026-06-02 · 3 min

Más allá de la manipulación independiente: clasificación justa con imitación entre pares

Descubre cómo la clasificación estratégica con equidad individual maneja la imitación entre agentes, mejorando la consistencia y mitigando distorsiones con un enfoque robusto.

2026-06-02 · 2 min

Convergencia de aproximaciones bi-escala markovianas en RL

Descubre cómo se demuestra la convergencia de algoritmos bi-escala bajo ruido markoviano, un avance clave para el aprendizaje por refuerzo off-policy.

2026-06-01 · 2 min

Convergencia no asintótica de algoritmos estocásticos: marco de Lyapunov

Descubre cómo el marco de Lyapunov permite analizar la convergencia en tiempo finito de algoritmos estocásticos como Q-learning y SGD. Ideal para IA y RL.

2026-06-01 · 1 min

Convergencia no asintótica de algoritmos estocásticos: marco de Lyapunov

Descubre cómo las funciones de Lyapunov permiten analizar la convergencia finita de algoritmos estocásticos en aprendizaje automático y refuerzo.

2026-06-01 · 2 min

Convergencia global CES: límites de campo medio a concentración semiclásica

La CES logra convergencia global en optimización estocástica mediante límites de campo medio y concentración semiclásica, superando colapsos de varianza.

2026-06-01 · 2 min

Garantías mejoradas para Langevin Monte Carlo con suavidad promedio

Descubre cómo la suavidad promedio mejora las garantías de Langevin Monte Carlo. Aplicaciones en IA y modelos lineales.

2026-06-01 · 2 min