DGLight: Ajuste Fino GRPO Guiado por DQN de Modelos de Lenguaje Grandes para el Control de Señales de Tráfico
Descubre DGLight: ajuste fino con GRPO guiado por DQN para optimizar el control de tráfico. Mejora la eficiencia y fluidez vehicular mediante aprendizaje por refuerzo.