La industria de semiconductores enfrenta un desafío crítico: obtener datos de entrenamiento precisos para modelos de visión artificial que inspeccionan geometrías a escala nanométrica. Las técnicas generativas como GANs o diffusion models ofrecen aumento de datos, pero no garantizan la exactitud geométrica necesaria para tareas metrológicas. Una solución innovadora consiste en un marco de síntesis de programas visuales donde un modelo de lenguaje y visión (VLM) convierte imágenes de inspección en código de un lenguaje de dominio específico (DSL) que describe las geometrías de los circuitos, permitiendo una generación controlada de datos con manipulación exacta de parámetros. Sin embargo, al entrenar el VLM exclusivamente con datos sintéticos renderizados mediante DSL, surge una brecha sim-real al procesar imágenes reales de microscopía electrónica de barrido (SEM). Para cerrar esta brecha, se utiliza una estrategia de binarización de entrada que elimina texturas y ruido propios del SEM, permitiendo que el modelo se concentre únicamente en la estructura geométrica. En el conjunto de datos MIIC, las entradas binarizadas mejoran el coeficiente Dice medio de 0.4393 a 0.5256 respecto a la línea base con entrada cruda, demostrando que una abstracción simple de textura mitiga significativamente la brecha sim-real.

Este enfoque tiene implicaciones profundas para la automatización de procesos en la fabricación de chips. La capacidad de generar datos sintéticos realistas y controlables mediante código DSL reduce drásticamente la necesidad de costosas anotaciones manuales y captura de imágenes reales. Además, la binarización actúa como un filtro que unifica la apariencia de imágenes de diferentes fuentes, facilitando la transferencia de modelos entrenados en simulación a entornos reales. En este contexto, empresas como Q2BSTUDIO, especializada en el desarrollo de aplicaciones a medida y soluciones de inteligencia artificial para empresas, ofrecen herramientas que integran estos avances. Nuestros servicios cloud AWS y Azure permiten desplegar modelos de visión a escala, mientras que nuestras aplicaciones a medida pueden incorporar pipelines de binarización y generación de datos sintéticos. También desarrollamos agentes IA que automatizan tareas de inspección y análisis, y utilizamos Power BI para visualizar métricas de rendimiento de modelos. La combinación de estas capacidades permite a los fabricantes de semiconductores acelerar la puesta en marcha de sistemas de inspección sin perder precisión nanométrica. La ciberseguridad en este ámbito es fundamental: al manejar datos sensibles de diseño de chips, es vital contar con protección adecuada. En definitiva, la binarización es un paso simple pero poderoso para cerrar la brecha sim-real, y con el apoyo de socios tecnológicos como Q2BSTUDIO, las empresas pueden implementar soluciones robustas y escalables.