Ajuste dinámico de entropía en control de drones con RL
El ajuste dinámico de entropía en RL mejora el control de drones, evitando olvido catastrófico y optimizando la exploración. Comparativa SAC vs TD3.
El ajuste dinámico de entropía en RL mejora el control de drones, evitando olvido catastrófico y optimizando la exploración. Comparativa SAC vs TD3.
Descubre cómo el MARL distribuido en red controla enjambres de cuadricópteros con escalabilidad zero-shot: entrena 3 agentes y despliega hasta 250. ¡Lee más!