De un U-Net básico a un desenmascarador SEM robusto

Cuando abordé por primera vez el problema de eliminar el ruido en imágenes de microscopía electrónica de barrido SEM pensé que la clave sería elegir la arquitectura correcta. Imaginé capas, profundidad y millones de parámetros. Tras tiempo de investigación y experimentos entendí que la verdadera pregunta era otra: cómo traducir la intuición del ingeniero a un objetivo matemático. En otras palabras, cómo decirle al modelo qué debe preservarse, como pequeños defectos, y qué está permitido eliminar, como el ruido del escaneo.

El reto en SEM es particular. La relación señal-ruido es baja porque el ruido no es gaussiano y proviene de la física del escaneo. Además, la sensibilidad a bordes es crítica pues en obleas cada línea o textura mínima puede indicar un defecto de fabricación. El balance está entre suavizar demasiado y perder defectos o no limpiar suficiente y dejar tanto ruido que la detección sea inviable.

Comencé con una referencia sencilla: un U-Net estándar entrenado con un conjunto pequeño de pares imagen ruidosa e imagen limpia. Usé una pérdida basada en error cuadrático medio combinada con un término de similitud estructural. Aunque las métricas convencionales parecían aceptables, visualmente el modelo tendía a difuminar bordes y detalles finos. El MSE penaliza fuertemente grandes errores y empuja al modelo a promediar texturas locales, lo que suaviza defectos críticos.

Frente a ese problema cambié la perspectiva: en vez de aumentar la capacidad del modelo pregunté dónde estaba el error. Observando mapas de diferencia noté que el modelo reaccionaba demasiado a píxeles aislados y sobre-suavizaba regiones enteras para minimizar unos pocos errores. La solución vino por ajustar la función objetivo: necesitaba una pérdida menos sensible a outliers, capaz de preservar texturas y bordes y lo suficientemente suave para entrenar redes profundas. La pérdida de Charbonnier cumplió ese rol. Sustituir MSE por Charbonnier mejoró PSNR y SSIM y, lo más importante, los bordes se veían más naturales y menos sobremediados.

Al trabajar con un dataset más complejo de obleas, con ruido sintético de alta intensidad y patrones periódicos, añadí dos componentes más a la pérdida. Primero MS-SSIM para medir similitud a varias escalas y así preservar estructura global y detalle fino. Segundo un término aware de bordes basado en gradientes con un operador tipo Sobel para penalizar que el modelo rompa o emborrone contornos presentes en la imagen. La función total combinó Charbonnier, MS-SSIM y la pérdida de borde. El resultado fue un salto claro en calidad: los defectos se mantuvieron nítidos sobre un fondo limpio y el modelo venció a métodos clásicos como BM3D o filtros bilaterales en las métricas y en la inspección visual de expertos.

Probé ideas que finalmente no llegaron a producción pero aportaron lecciones importantes. La predicción de residuo, es decir estimar el ruido en lugar de la imagen limpia, generó inestabilidad y artefactos alrededor de bordes en este tipo de ruido complejo. Incrementar la profundidad del U-Net aumentó tiempos de entrenamiento e inferencia sin mejoras consistentes. Añadir un mapa de bordes como canal extra de entrada no aportó ganancia una vez que la pérdida ya era edge-aware y solo complicó el pipeline. Estas experiencias confirmaron una idea central: muchas veces es mejor codificar prioridades en la pérdida y no en trucos de entrada o simplemente aumentar capacidad.

Validé el enfoque comparando el U-Net con desruidores clásicos. El modelo de deep learning superó claramente en calidad a los métodos tradicionales, aunque estos últimos son más sencillos de desplegar, funcionan en CPU y no necesitan datos etiquetados, lo que los hace útiles en prototipos o entornos con recursos limitados. La conclusión práctica fue que para líneas de producción de alto rendimiento y cuando la infraestructura existe, la solución basada en redes es la más adecuada; para escenarios de menor volumen, los clásicos siguen siendo viables.

Desde el inicio diseñé el proyecto con producción en mente: modularidad para separar cargas de datos, definición de modelos, métricas y código de experimentos; ejecución basada en configuraciones para reproducibilidad y facilidad de ajuste de hiperparámetros; y una tubería de evaluación que automatiza métricas, guarda ejemplos visuales y compara frente a métodos clásicos. Finalmente empaqueté el modelo en una API e integré la herramienta en una aplicación donde los usuarios pueden seleccionar modelos y ver resultados en tiempo real.

La lección principal es que en deep learning la definición del problema es tan importante como el diseño de la arquitectura. Cambiar el foco de qué red usar a qué debe optimizar la red mediante ingeniería de la pérdida permitió preservar pequeños defectos críticos que otros métodos borraban. No se trata solo de las últimas herramientas sino de combinar conocimiento del dominio y datos con el objetivo correcto para que el modelo aprenda.

En Q2BSTUDIO somos especialistas en convertir retos así en soluciones industriales. Como empresa de desarrollo de software y aplicaciones a medida diseñamos pipelines de procesamiento de imagen, sistemas de inteligencia artificial para empresas y servicios cloud a medida tanto en AWS como en Azure. Ofrecemos software a medida, integración de modelos de IA, agentes IA para automatizar tareas y proyectos de inteligencia de negocio y power bi para extraer valor de los datos. Si su organización necesita una solución que preserve información crítica en imágenes o integrar modelos en producción, contamos con experiencia en ciberseguridad y pentesting para asegurar despliegues robustos y seguros.

Si quiere conocer cómo aplicamos modelos de visión o desarrollar una solución de aplicaciones a medida visite nuestra sección de aplicaciones a medida y para explorar nuestros servicios de Inteligencia artificial para empresas encontrará casos, metodologías y opciones de integración. Palabras clave que describen nuestro foco incluyen aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA y power bi. En Q2BSTUDIO transformamos conocimiento de dominio en objetivos de aprendizaje para modelos que realmente resuelven problemas reales.

Compartir

Comentarios

También te puede interesar

De la confusión a la claridad: Construyendo mi primer agente de investigación en la Intensiva de IA de Google

La guía completa para meta-prompting: la técnica de hacer que la IA escriba tus indicaciones

Top 15 Expertos en bots de Telegram en Villava

Sistema inteligente de planificación de viajes multiagente

Las 10 mejores empresas de servicios telefónicos de IA en Molina de Segura

Los 20 mejores expertos en sistema telefónico de inteligencia artificial en Tudela