La robótica doméstica avanza hacia un futuro donde los robots no solo ejecuten tareas predefinidas, sino que aprendan a manipular objetos en entornos reales y cambiantes. Uno de los grandes desafíos en este campo es la manipulación de objetos deformables —como ropa, toallas o cortinas— que presentan infinitas variaciones de forma, material y estado inicial. Hasta ahora, los sistemas de visión-lenguaje-acción (VLA) solían entrenar modelos separados para cada categoría de objeto, lo que limitaba su capacidad de generalización y generaba interferencias al combinar múltiples tareas. Frente a esta limitación, surge DeMaVLA, un modelo fundacional VLA diseñado específicamente para la manipulación deformable. Este enfoque integra un modelo de lenguaje y visión (VLM) como columna vertebral, un experto de acción optimizado mediante poda selectiva de capas transformer, y un mecanismo de generación continua de acciones basado en flow matching. El modelo se entrena con aproximadamente 5.000 horas de demostraciones reales con brazos robóticos duales, combinadas con correcciones humanas a través de un proceso iterativo de agregación de datos (DAgger). Los resultados muestran un rendimiento competitivo en benchmarks robóticos y una notable capacidad de adaptación a escenarios cotidianos.

Este tipo de innovación no solo tiene implicaciones en la robótica de consumo, sino que abre la puerta a aplicaciones empresariales donde la inteligencia artificial debe operar sobre datos no estructurados y condiciones variables. Por ejemplo, en almacenes inteligentes, robots equipados con modelos VLA podrían clasificar ropa o productos blandos sin necesidad de reentrenamiento constante. Para lograr estas implementaciones, contar con soluciones de inteligencia artificial para empresas que integren modelos fundacionales con infraestructura cloud es clave. En Q2BSTUDIO desarrollamos aplicaciones a medida y software a medida que permiten a las organizaciones adoptar estas tecnologías con garantías de escalabilidad y seguridad. Además, ofrecemos servicios cloud aws y azure para gestionar los volúmenes masivos de datos y entrenamiento que requieren estos modelos, así como servicios inteligencia de negocio con power bi para visualizar el rendimiento de los robots en tiempo real. La ciberseguridad también es un pilar fundamental, especialmente cuando los sistemas robóticos se conectan a redes corporativas o cloud público.

El desarrollo de agentes IA capaces de aprender de la interacción humana, como se demuestra con el pipeline DAgger de DeMaVLA, representa un salto cualitativo hacia robots más autónomos y adaptables. Desde una perspectiva empresarial, la combinación de modelos VLA con prácticas de corrección continua permite reducir drásticamente los costes de programación manual y acelerar la implantación en entornos productivos. En Q2BSTUDIO ayudamos a las empresas a explorar estas fronteras tecnológicas, combinando nuestra experiencia en automatización, cloud e inteligencia artificial para crear soluciones robustas y listas para el mundo real. La manipulación deformable es solo el comienzo de una nueva ola de robots que interactuarán con todo tipo de objetos no rígidos, y quienes inviertan hoy en plataformas flexibles y en alianzas estratégicas con socios tecnológicos estarán mejor posicionados para liderar ese futuro.