El avance de los modelos multimodales de lenguaje grande (MLLMs) ha puesto sobre la mesa un desafío crucial: su capacidad para comprender y actuar en entornos tridimensionales. Hasta ahora, las evaluaciones se limitaban a pruebas estáticas o simuladores muy específicos, sin reflejar la complejidad del mundo real. En este contexto surge SpatialWorld, un nuevo benchmark diseñado para medir el razonamiento espacial interactivo de agentes de inteligencia artificial. La propuesta integra ocho simuladores heterogéneos bajo un protocolo unificado, ofreciendo 760 tareas anotadas por humanos que abarcan desde rutinas domésticas hasta colaboración social. Los agentes deben operar con visibilidad parcial, únicamente a través de evidencia visual egocéntrica, y tomar decisiones mediante una interfaz textual común a los MLLMs.

Los resultados de evaluar 15 agentes avanzados son reveladores: el modelo más potente, GPT-5, apenas alcanza un 17,4% de éxito en tareas, mientras que el mejor código abierto, Qwen-3.5, logra un 14,1%. Estas cifras evidencian que la navegación activa y la planificación a largo plazo siguen siendo cuellos de botella significativos. La brecha entre el éxito en la tarea y la eficiencia de ejecución, junto con las variaciones según el dominio, convierten a SpatialWorld en un banco de pruebas riguroso para futuros agentes espaciales.

Para las empresas que buscan integrar inteligencia artificial en sus procesos, este tipo de desarrollos subraya la importancia de contar con soluciones robustas de software a medida y aplicaciones a medida. En Q2BSTUDIO, entendemos que la implementación de ia para empresas no se limita a elegir un modelo preentrenado; requiere diseñar sistemas que puedan interactuar de manera contextual con el entorno, ya sea mediante agentes IA personalizados o plataformas que combinen servicios cloud aws y azure para escalar el procesamiento. Además, la seguridad de estos sistemas es crítica, por lo que ofrecemos ciberseguridad y pentesting para proteger cada capa de la arquitectura. En el ámbito analítico, nuestros servicios inteligencia de negocio con power bi permiten visualizar el rendimiento de estos agentes y optimizar decisiones basadas en datos. Para profundizar en cómo la IA para empresas puede transformar sus operaciones, le invitamos a conocer nuestras soluciones.