Compensación de Retardo Desacoplada: Mejora de Políticas MARL Pre-entrenadas mediante Filtrado de Dinámicas Aprendidas
Método de optimización MARL que combina compensación de retardo desacoplada y filtrado de dinámicas aprendidas para mejorar la eficiencia en sistemas multiagente.