OmniTraffic: Generación controlable y benchmark para razonamiento de tráfico
El entendimiento de escenas de tráfico ha evolucionado más allá del simple reconocimiento de objetos, exigiendo modelos capaces de razonar sobre topología de carriles, geometría multivista, evolución temporal y semántica de fases de señales. Hasta ahora, los benchmarks multimodales orientados al tráfico se centraban en reconocimiento visual pasivo o comprensión de video aislada, sin soportar evaluaciones controladas de razonamiento estructural. OmniTraffic surge como un pipeline de generación controlable y benchmark para razonamiento espacio-temporal en tráfico, construido sobre doce intersecciones reales reconstruidas como entornos 3D editables, complementadas con metraje de vigilancia de dos países. Define una jerarquía de tareas de tres niveles que abarca percepción de escena, razonamiento multivista y temporal, y soporte a decisiones. Mediante metadatos de tráfico estructurados, genera muestras sincronizadas de VQA (pregunta-respuesta visual) sobre estados de vehículos, funciones de carril, correspondencia vista-BEV, dinámicas temporales y análisis de fase de señales, logrando 8 millones de muestras y un conjunto de prueba verificado por humanos de 3 mil casos. La evaluación de once MLLMs de frontera revela una brecha enorme con el rendimiento humano, especialmente en razonamiento topológico y espacio-temporal. El ajuste fino de un modelo ligero con datos simulados mejora el desempeño en escenarios reales, demostrando el valor de la supervisión generada por simulación. Este enfoque se alinea con la necesidad de inteligencia artificial para empresas que buscan soluciones de razonamiento visual avanzado. En Q2BSTUDIO, desarrollamos aplicaciones a medida y ofrecemos servicios como software a medida, inteligencia artificial, ciberseguridad, servicios cloud AWS y Azure, servicios inteligencia de negocio y Power BI, integrando agentes IA para procesos complejos. La capacidad de generar entornos controlados con rarezas y condiciones variables, como hace OmniTraffic, es directamente aplicable al desarrollo de sistemas de asistencia al conductor y gestión de tráfico urbano, donde la simulación permite entrenar modelos robustos sin exponerlos a riesgos reales. Este pipeline extensible, con intersecciones configurables, cámaras, demandas de tráfico y fases de señal, representa un avance clave para la investigación aplicada y la ingeniería de ia para empresas, facilitando la transferencia de conocimiento de laboratorio a producción.
Comentarios