#gradiente variacional de stein

Optimización de Políticas Proximales Variacionales

Descubre VP2O, el nuevo marco de optimización variacional que logra +179 ELO en Codeforces y reduce un 32% los tokens en tareas matemáticas.

2026-06-09 · 1 min

RL para Políticas de Flow-Matching con Transporte de Densidad

RLDT: algoritmo RL con transporte de densidad y gradiente variacional para mejorar políticas de flujo, superando a métodos previos en control continuo.

2026-06-09 · 2 min