#convergencia demostrable

Actor-Critic convergente para MARL mediante aversión al riesgo

Descubre un algoritmo Actor-Critic que converge globalmente en juegos multiagente incorporando aversión al riesgo. Garantías de muestra finita y superioridad sobre métodos neutrales al riesgo.

2026-06-03 · 2 min