CODA: Coordinación mediante difusión on-policy para el aprendizaje por refuerzo fuera de línea multiagente
CODA: coordinación con difusión on-policy para aprendizaje por refuerzo offline multiagente. Optimiza la colaboración de agentes en entornos offline.