Marco de aprendizaje por refuerzo con descomposición de valores para el enrutamiento en calles de rodaje con observaciones jerárquicas conscientes de conflictos
<meta name=description content=Marco de RL con descomposición de valores y observaciones jerárquicas optimiza el enrutamiento en calles de rodaje. Descubre cómo esta técnica mejora la navegación y eficiencia aeroportuaria.>