Este artículo presenta una reescritura y traducción al español del estudio sobre la optimización del grabado por plasma de argón mediante un marco dinámico de aprendizaje por refuerzo multobjetivo MORL para ajuste en tiempo real de parámetros de proceso.

Resumen ejecutivo El grabado por plasma de argón en microfabricación enfrenta el reto de optimizar simultáneamente velocidad de grabado, selectividad y uniformidad sobre distintos sustratos. Proponemos un marco MORL dinámico que ajusta parámetros en tiempo real mediante un agente de aprendizaje por refuerzo entrenado contra un simulador de plasma de alta fidelidad. Los resultados muestran mejoras del 5-10% en eficiencia de grabado y reducción de defectos del 2-3% respecto a métodos de control con realimentación tradicionales, acelerando el desarrollo de procesos, reduciendo desperdicio de material y mejorando el rendimiento de dispositivo.

Contexto y motivación El grabado por plasma de argón permite eliminar material con precisión para crear patrones en obleas, pero el compromiso entre alta velocidad, alta selectividad y uniformidad es complejo y depende de parámetros como potencia RF, caudales de gas y presión de cámara. Los controles tradicionales usan sintonía empírica y experimentación offline, lo que limita la capacidad de optimizar objetivos en conflicto de forma adaptativa. Este trabajo impulsa una transición hacia estrategias de control proactivas y adaptativas basadas en MORL.

Simulador y modelo físico El núcleo del sistema es un simulador integrado que combina modelos establecidos de comportamiento del plasma: Boltzmann Transport Equation para la distribución energética de electrones y tasas de reacción, un modelo de tipo fluido para transporte y química de especies neutras y un modelo de química superficial que captura mecanismos de grabado y pasivación. El simulador está desarrollado en COMSOL Multiphysics y expone una interfaz de control que permite interacción continua con el agente. El estado del sistema st agrupa parámetros de entrada potencia RF P, caudal Argón QAr, caudal Oxígeno QO2 y presión p y métricas de salida velocidad de grabado R, selectividad S y uniformidad U.

Agente de aprendizaje y formulación MORL Empleamos una variante de Double DQN para reducir la sobreestimación de q valores y estabilizar el aprendizaje. El espacio de estados combina métricas operativas y de proceso. El espacio de acciones está formado por ajustes discretos sobre P, QAr, QO2 y p. La función de recompensa rt es una suma ponderada de las métricas objetivo rt = w1 Rt + w2 St + w3 Ut con pesos w1, w2, w3 que se ajustan dinámicamente según una política de priorización que depende de las condiciones de proceso y requisitos de fabricación, por ejemplo priorizar selectividad en etapas iniciales y luego velocidad de grabado.

Diseño experimental y validación Se realizan simulaciones comparativas frente a un controlador PID afinado convencional, análisis de sensibilidad de parámetros y pruebas de escenario sobre sustratos de Silicio, Dioxido de Silicio y Nitruro de Galio, así como diversas geometrías de dispositivo. Las métricas evaluadas incluyen velocidad de grabado en Å por minuto, relación de selectividad SiO2 sobre Si, uniformidad medida por desviación estándar relativa y tiempo de convergencia hacia una política estable. La significación estadística se evalúa con pruebas t para muestras independientes con nivel alfa 0.05.

Resultados principales y robustez El marco MORL demuestra mejoras prácticas: 5-10% en eficiencia de grabado y 2-3% en reducción de defectos con respecto a controladores PID tradicionales en los escenarios simulados. El ajuste dinámico de pesos permite responder a variaciones en sustrato, desgaste de cámara o cambios en suministro de gases, manteniendo consistencia y reduciendo reprocesos. La combinación del motor físico con el agente Double DQN y un buffer de experiencias personalizado mejora la estabilidad y la velocidad de aprendizaje.

Escalabilidad y hoja de ruta Corto plazo dentro de 1 año integración con equipos de grabado existentes mediante interfaz de control estandarizada. Medio plazo dentro de 3 años extensión a sistemas multi cámara e inclusión de diagnósticos en tiempo real para ajustes adaptativos. Largo plazo dentro de 5 años desarrollo de un sistema de control cerrado que automatice el proceso de grabado y habilite estrategias de autooptimización.

Contribuciones técnicas clave Integración coherente de BTE, modelos fluidos y química superficial en un entorno de aprendizaje por refuerzo multobjetivo, uso de Double DQN y esquema de ponderación dinámica de objetivos, validación cuantitativa frente a métodos tradicionales y análisis de sensibilidad y robustez frente a distintos sustratos y geometrías. Este enfoque es aplicable de forma inmediata en entornos comerciales y de I D para acelerar la puesta a punto de procesos en fabricación de semiconductores.

Aplicaciones industriales y sostenibilidad La mejora en rendimiento y reducción de defectos se traduce en beneficios económicos y ambientales: menor consumo de material, menos reprocesos y mayores tasas de obleas útiles por lote. Para plantas de fabricación, la implementación de MORL puede reducir tiempos de desarrollo y costes operativos, potenciando el rendimiento de la cadena de valor.

Sobre Q2BSTUDIO y servicios relacionados Q2BSTUDIO es una empresa de desarrollo de software y aplicaciones a medida especializada en soluciones de inteligencia artificial, ciberseguridad y servicios cloud. Ofrecemos desarrollo de software a medida y aplicaciones a medida adaptadas a necesidades industriales, integración de modelos de inteligencia artificial y despliegue en infraestructuras seguras en AWS y Azure. Nuestro equipo combina expertos en IA para empresas, diseño de agentes IA y análisis con herramientas como Power BI para inteligencia de negocio, garantizando soluciones que aumentan rendimiento y reducen riesgos operativos.

Servicios complementarios para tecnología de procesos Además de la implementación MORL, Q2BSTUDIO proporciona consultoría en ciberseguridad y pentesting para proteger sistemas de control industrial, servicios de automatización de procesos para integrar controladores inteligentes y soluciones de servicios cloud aws y azure para escalabilidad y monitorización remota. Para conocer nuestros servicios de inteligencia artificial visite la página de inteligencia artificial y descubra cómo diseñamos agentes IA y plataformas analíticas que convierten datos de proceso en decisiones operativas.

Conclusión El marco dinámico MORL para grabado por plasma de argón presenta una solución práctica y validada en simulación para optimizar objetivos competitivos en procesamiento de obleas. Al integrar modelos físicos robustos con técnicas avanzadas de aprendizaje por refuerzo y una estrategia de ponderación dinámica, se logra una mejora medible en eficiencia y calidad. Q2BSTUDIO está preparada para llevar estas capacidades al entorno productivo mediante desarrollos a medida que combinan inteligencia artificial, servicios cloud, ciberseguridad, automatización de procesos y business intelligence con Power BI para impulsar la transformación digital de la industria semiconductor.