Desde un U-Net básico hasta un desenrrollador SEM robusto
Desde un U-Net básico hasta un desenrrollador SEM robusto
Cuando abordé por primera vez el problema del desruido en imágenes de microscopía electrónica de barrido SEM asumí que la clave sería elegir la arquitectura correcta. Pensaba en capas, profundidad y parámetros. Tras investigar y experimentar comprendí que la pregunta real era otra: cómo traduzco la intuición del ingeniero a un objetivo matemático. Dicho de otro modo, cómo le digo al modelo qué debe preservarse, como defectos minúsculos, y qué se puede eliminar, como el ruido del escaneo.
El desafío es particular: el ruido forma parte de la señal. Las imágenes SEM plantean un reto específico de visión por computadora. Baja relación señal-ruido porque el ruido no es gaussianamente agradable sino que procede de la física del escaneo. Sensibilidad a bordes porque en obleas cada línea o textura pequeña puede indicar un defecto crítico en fabricación. El equilibrio es delicado: demasiada suavización borra defectos reales, poca eliminación de ruido deja escenas difíciles de analizar.
Paso 1 Baseline con U-Net y los límites del MSE. Empecé con una U-Net estándar como referencia y un pequeño conjunto de pares imagen ruidosa y limpia. Usé MSE combinado con SSIM como función de pérdida. Las métricas parecían aceptables pero visualmente el modelo tendía a emborronar bordes. MSE penaliza fuertemente los errores grandes y empuja al modelo a promediar extremos locales, produciendo texturas suavizadas en lugar de la verdad microscópica. Aun así esta línea base fue crucial para medir mejoras posteriores.
Paso 2 Redefinir el error: Charbonnier. En lugar de aumentar la complejidad del modelo pregunté dónde fallaba exactamente. Observé que el modelo reaccionaba demasiado a píxeles aislados ruidosos y sobre-suavizaba regiones completas para reducir unos pocos errores grandes. Entonces cambié la medida de error. Buscaba algo menos sensible a outliers, capaz de conservar texturas y bordes, y diferenciable para entrenar redes profundas. La pérdida de Charbonnier cumplió ese perfil porque se comporta como L1 robusto pero es suave. Con el mismo U-Net y datos, reemplazar MSE por Charbonnier mejoró PSNR y SSIM y preservó bordes y defectos con menos sobre-suavizado.
Paso 3 Wafers, estructura y conciencia de bordes. Al trabajar con un dataset mayor de obleas con ruido sintético de alta intensidad, las exigencias cambiaron. Las tramas periódicas y los defectos minúsculos ganaron importancia. Actualicé la pérdida añadiendo MS-SSIM para evaluar similitud a múltiples escalas y un término edge-aware basado en gradientes tipo Sobel para penalizar cuando el modelo rompía o emborronaba bordes presentes en la entrada. Esta combinación mantuvo la estructura global y los detalles finos, y los defectos permanecieron nítidos sobre un fondo limpio. Los resultados superaron métodos clásicos como BM3D y filtros bilaterales tanto en métricas como en inspección visual de expertos.
Qué no funcionó y lecciones aprendidas. Probé predicción de residuo, es decir predecir ruido en lugar de imagen limpia. Para el ruido SEM complejo y con datos limitados esto hizo el entrenamiento menos estable y generó artefactos cerca de bordes. No siempre aprender el residuo es mejor. Aumentar la profundidad del U-Net incrementó tiempo de entrenamiento e inferencia sin mejoras claras: más capacidad no siempre aporta valor si la función objetivo está bien diseñada. Añadir el mapa de bordes como canal extra tampoco mejoró: cuando la pérdida ya incorpora conciencia de bordes la red aprende a enfatizarlos directamente y complicar la entrada fue innecesario. Esto reafirma que muchas prioridades se deben codificar en la pérdida y no solo en los inputs.
Comparativa con métodos clásicos. Aunque el modelo profundo superó a los desruidores clásicos en calidad, la comparación debe incluir velocidad y despliegue. Los métodos clásicos son fáciles de desplegar, funcionan en CPU y no requieren datos de entrenamiento, útiles en prototipos o entornos con pocos recursos. El enfoque de aprendizaje profundo exige datos etiquetados, entrenamiento inicial y aceleración por GPU para procesamiento en tiempo real. En líneas de producción de alto volumen con infraestructura adecuada la IA suele vencer. En escenarios de menor volumen los filtros clásicos siguen siendo prácticos.
Ingeniería para producción. Un buen modelo no puede quedarse en un notebook. El proyecto se diseñó con producción en mente: modularidad clara entre loaders, definiciones de modelo, métricas y scripts de experimentos; experimentos definidos por configuración para reproducibilidad; una tuberia de evaluación automática que calcula múltiples métricas, guarda ejemplos visuales y compara con métodos clásicos; y finalmente integración del modelo entrenado en una API y una aplicación donde los usuarios pueden seleccionar modelos y ver resultados en tiempo real. Esta orientación al producto facilita llevar la investigación al entorno industrial.
Q2BSTUDIO y cómo podemos ayudar. En Q2BSTUDIO somos especialistas en transformar soluciones de inteligencia artificial en productos robustos y escalables. Ofrecemos desarrollo de aplicaciones a medida y software a medida que integran modelos de visión por computadora en flujos de trabajo reales. Si tu proyecto requiere desplegar modelos de desruido SEM en producción o crear pipelines de análisis automatizado, podemos acompañarte desde la experimentación hasta la entrega. Trabajamos también servicios cloud aws y azure para escalado y despliegue, ciberseguridad y pentesting para proteger infraestructuras, y servicios inteligencia de negocio como Power BI para explotar los resultados en dashboards accionables. Descubre nuestras propuestas de IA y cómo aplicarlas a tu empresa en IA para empresas y si te interesa construir una solución integrada podemos desarrollar tus aplicaciones a medida.
Conclusión. La lección más importante fue que en deep learning la definición del problema es tan crítica como la elección de arquitectura. Cambiar el foco de qué modelo usar a qué objetivo optimiza el rendimiento y preserva los detalles críticos que otros métodos tienden a borrar. Una solución poderosa combina buenas herramientas con comprensión profunda de los datos y el dominio, y traduce esa comprensión en una función objetivo adecuada. Si buscas llevar proyectos de visión industrial, IA para empresas, agentes IA o integrar analítica avanzada con Power BI, Q2BSTUDIO puede ayudarte a convertir investigación en producto.
Comentarios