La extracción automática de datos científicos a partir de la literatura ha experimentado un salto cualitativo con la llegada de los modelos de lenguaje de gran escala (LLMs). Sin embargo, hasta ahora la mayoría de los sistemas se limitaban a procesar texto y tablas, dejando de lado una fuente inmensa de información: las figuras y gráficos. En disciplinas como la ciencia de materiales, donde propiedades clave como el coeficiente piezoeléctrico d33 se reportan casi exclusivamente en diagramas, esta omisión suponía un cuello de botella significativo. El reciente desarrollo de ComProScanner, un marco multi-agente de extremo a extremo, rompe esta barrera al integrar capacidades nativas de modelos de visión-lenguaje (VLM). Su extensión permite filtrar figuras mediante palabras clave de los pies de imagen y, a través de un agente especializado (GraphExtractorTool), recuperar pares composición-propiedad directamente desde gráficos científicos. Esta innovación no solo acelera la construcción de bases de datos estructuradas, sino que abre la puerta a una nueva generación de plataformas de minería de literatura multimodal.

Detrás de este avance hay un enfoque técnico que combina eficiencia y precisión. Los evaluadores seleccionaron cuatro VLMs de última generación, todos con un coste inferior a 1,50 dólares por millón de tokens, y los probaron sobre un corpus de 50 artículos de cerámicas piezoeléctricas. El modelo Gemini-3-Flash-Preview alcanzó una precisión de composición de 0,97 y un F1 normalizado de 0,97, demostrando que es posible obtener datos fiables sin incurrir en gastos desorbitados. Además, la incorporación de un umbral de error basado en rangos —en lugar de una coincidencia exacta de valores— proporciona una evaluación más realista de las propiedades numéricas extraídas, alineada con la naturaleza aproximada de la lectura de gráficos. Este enfoque no solo mejora la calidad de los datos, sino que establece un estándar para futuras herramientas de extracción científica.

La integración de inteligencia artificial en procesos de investigación tiene un paralelo directo con el mundo empresarial. Así como ComProScanner automatiza la recopilación de datos de figuras para acelerar descubrimientos en ciencia de materiales, las empresas pueden beneficiarse de ia para empresas que transformen información no estructurada en conocimiento accionable. Por ejemplo, un sistema basado en agentes IA podría analizar informes financieros, gráficos de mercado o diagramas técnicos para extraer indicadores clave, liberando a los equipos de tareas tediosas. En este contexto, contar con un socio tecnológico que desarrolle aplicaciones a medida permite adaptar estas capacidades a las necesidades específicas de cada organización, ya sea en el ámbito de la investigación, la logística o la toma de decisiones estratégicas.

Q2BSTUDIO, como empresa de desarrollo de software a medida, entiende que la verdadera ventaja competitiva surge cuando la tecnología se ajusta al flujo de trabajo del cliente. No se trata solo de implementar un modelo de inteligencia artificial, sino de construir una orquestación completa que combine extracción de datos, procesamiento en la nube y visualización. Por eso ofrecemos servicios cloud aws y azure que garantizan escalabilidad y seguridad, junto con servicios inteligencia de negocio que convierten los datos en paneles interactivos con herramientas como power bi. Además, en un mundo donde la información es el activo más valioso, la ciberseguridad se vuelve crítica: proteger los pipelines de datos, ya sean científicos o empresariales, es parte integral de cualquier solución robusta.

Mirando hacia el futuro, la convergencia entre modelos de visión-lenguaje y sistemas multi-agente promete revolucionar no solo la ciencia de materiales, sino cualquier campo donde la información visual sea abundante. La capacidad de extraer datos de figuras de forma automatizada, con alta precisión y bajo coste, acerca la promesa de una ciencia completamente digitalizada. Al mismo tiempo, las empresas que adopten estas metodologías —con el apoyo de expertos en desarrollo de aplicaciones a medida— podrán automatizar procesos complejos, desde la revisión de documentos hasta el análisis de tendencias de mercado. La clave está en combinar el mejor talento técnico con una visión práctica de negocio, algo que en Q2BSTUDIO aplicamos día a día para ayudar a nuestros clientes a dar el salto hacia la inteligencia artificial aplicada de forma tangible.