Galaxias con Aprendizaje Profundo: Del Polvo Estelar al Código

El universo es vasto y alberga miles de millones de galaxias, cada una con una forma y una historia propias. Durante más de un siglo, los astrónomos han clasificado galaxias observando a simple vista categorías como espiral, con brazos elegantes, y elíptica, como manchas redondeadas. En este proyecto diseñamos una red neuronal convolucional que clasifica galaxias entre espiral y elíptica, y lo convertimos en una tubería completa que va desde el preprocesado de datos hasta el despliegue de una aplicación web en tiempo real.

El problema a resolver parecía sencillo a primera vista: las espirales muestran brazos y las elípticas parecen manchas suaves. Sin embargo, muchos conjuntos de datos astronómicos contienen imágenes ruidosas, muy tenues o de baja resolución donde incluso expertos pueden discrepar. La pregunta central fue si un modelo de aprendizaje automático puede aprender esas diferencias sutiles y automatizar la clasificación.

El conjunto de datos utilizado consistió en imágenes etiquetadas de galaxias redimensionadas a 256×256 píxeles en RGB, con dos clases: espiral y elíptica. Los datos se dividieron en conjuntos de entrenamiento y prueba para garantizar una evaluación en imágenes no vistas durante el entrenamiento. En el preprocesado se normalizaron los píxeles a valores entre 0 y 1 y se probaron técnicas de aumento de datos como volteos y rotaciones para aumentar la robustez frente a variaciones.

La columna vertebral del proyecto fue una red neuronal convolucional. La arquitectura incluyó capas de convolución seguidas de ReLU para extraer bordes, curvas y texturas; capas de max pooling para reducir dimensionalidad preservando rasgos clave; capas densas para combinar características aprendidas; y una capa de salida con softmax para predecir la probabilidad de ser espiral o elíptica. El modelo se implementó con TensorFlow y Keras y se entrenó durante 10 épocas con un tamao de lote de 32.

En las primeras etapas el modelo mostró un sesgo hacia la clase espiral debido al desbalance en los datos y la falta de validación adecuada. Tras introducir un split de validación, balancear clases y ajustar hiperparámetros, el rendimiento mejoró notablemente. Resultados finales ilustrativos: exactitud en el conjunto de prueba aproximadamente 90 por ciento. La matriz de confusión reveló que el modelo distingue bien las categorías, aunque aún falla en casos límite donde las imágenes son muy tenues o presentan rasgos mezclados.

Ejemplos de predicciones mostraron aciertos y errores reveladores. Por ejemplo, una imagen etiquetada como elíptica fue predicha como espiral, lo que coincide con situaciones donde incluso un observador humano podría dudar. Estas discrepancias ayudan a entender los límites del modelo y guían futuras mejoras en anotación y arquitectura.

Lecciones clave aprendidas: los conjuntos de datos balanceados importan para evitar sesgos; la validación es crítica para evaluar la generalización; la augmentación y normalización mejoran la robustez; y el despliegue convierte la investigación en una herramienta usable. Para ilustrar el recorrido completo desarrollamos una aplicación Streamlit que permite probar el clasificador en tiempo real e interactuar con los resultados.

En Q2BSTUDIO desarrollamos soluciones de software a medida y aplicaciones a medida que transforman proyectos experimentales en productos listos para producción. Somos especialistas en inteligencia artificial y ofrecemos servicios de IA para empresas que incluyen diseño de modelos, agentes IA y despliegue en infraestructuras seguras. Nuestro equipo también cubre ciberseguridad, pentesting, y soluciones en la nube como servicios cloud aws y azure para garantizar escalabilidad y fiabilidad. Si tu proyecto necesita una solución de IA aplicada o una app personalizada visita inteligencia artificial de Q2BSTUDIO y conoce cómo podemos acelerar tu transformación digital con software a medida y agentes IA.

Además ofrecemos servicios de inteligencia de negocio y Power BI para convertir datos en decisiones estratégicas y automatización de procesos que optimizan operaciones. Si buscas desarrollar una aplicación multiplataforma a medida consulta nuestras capacidades en aplicaciones a medida y descubre cómo combinamos ingeniería de software, analytics y ciberseguridad para llevar tus ideas del polvo estelar al código en producción.

Palabras clave integradas: aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA y power bi.