El diseño de redes de transporte urbano, especialmente la expansión de sistemas de metro, representa un desafío complejo de optimización combinatoria. Tradicionalmente, abordar problemas como el Metro Network Expansion Problem (MNEP) requería métodos exactos o heurísticos con restricciones definidas por expertos, o bien el uso de deep reinforcement learning, que aunque efectivo, resulta costoso computacional y ambientalmente. Investigaciones recientes demuestran que, para ciertos problemas de tamaño manejable, el aprendizaje por refuerzo tabular puede alcanzar un rendimiento similar al deep RL con una fracción de los episodios de entrenamiento y emisiones de carbono, además de ofrecer una interpretabilidad mucho mayor. Al reformular el MNEP como un proceso de decisión con recompensas no markovianas e incorporar criterios de equidad social en las funciones de recompensa, se logra un equilibrio entre eficiencia y justicia, como se ha validado en casos reales como Xi'an y Ámsterdam.

Este enfoque modular y replicable abre la puerta a aplicaciones en otros problemas de optimización. Para implementar soluciones de este tipo en entornos empresariales, contar con ia para empresas y software a medida resulta fundamental. En Q2BSTUDIO ofrecemos desarrollo de aplicaciones a medida que integran inteligencia artificial, servicios cloud aws y azure, y ciberseguridad, permitiendo a las organizaciones desplegar sistemas de planificación urbana o logística con agentes IA eficientes y transparentes. Además, combinamos estas capacidades con servicios inteligencia de negocio mediante power bi, facilitando la visualización de indicadores de rendimiento y equidad.

La transición de modelos complejos de deep learning a métodos más ligeros como el RL tabular no solo reduce costes y emisiones, sino que también democratiza el acceso a técnicas de optimización avanzada. Empresas que buscan automatizar procesos de toma de decisiones pueden beneficiarse de este tipo de algoritmos, implementados con plataformas en la nube y bajo estrictos estándares de ciberseguridad. En definitiva, la investigación en expansión de metro con aprendizaje por refuerzo tabular ejemplifica cómo la inteligencia artificial bien diseñada puede ser a la vez potente y sostenible, un principio que aplicamos en cada proyecto de software a medida.