#difusión on-policy

CODA: Coordinación mediante difusión on-policy para el aprendizaje por refuerzo fuera de línea multiagente

CODA: coordinación con difusión on-policy para aprendizaje por refuerzo offline multiagente. Optimiza la colaboración de agentes en entornos offline.