Maestro de la forja: Texto a 3D en GPU en Cloud Run
Resumen rápido: Construimos Forge Master, una pequeña aplicación web que convierte descripciones de texto cortas en activos 3D listos para producción en alrededor de noventa segundos. La aplicación se ejecuta en Cloud Run con una GPU NVIDIA L4, emplea modelos de imagen para generar imágenes de referencia nítidas, técnicas de reconstrucción como Zero123++ y LRM para obtener mallas, y un agente de lenguaje para mejorar prompts y realizar control de calidad.
Por qué elegimos Cloud Run GPU: Queríamos ejecutar reconstrucción 3D real sin gestionar clústeres. Cloud Run GPU nos permitió desplegar un contenedor con PyTorch, Diffusers e InstantMesh, escalar desde cero y mantener costes acotados. Separar un frontend público de un backend GPU protegido con IAM hizo seguro abrir la demo al público sin riesgo de costes inesperados.
Arquitectura de alto nivel: Frontend en Cloud Run con Next.js y visualizador basado en React Three Fiber. Servicio agente en Cloud Run que gestiona enriquecimiento del prompt, coordinación de generación, QA y mejoras iterativas. Servicio GPU en Cloud Run GPU L4 que ejecuta generación de imágenes de referencia, reconstrucción Zero123++ y LRM, postprocesado y exportación a formatos GLB OBJ FBX STL. Almacenamiento en Cloud Storage para modelos y vistas múltiples. IAM de Cloud Run para que solo el agente pueda invocar el servicio GPU.
Tres aciertos del fin de semana de desarrollo: interfaces pequeñas y explícitas entre servicios con llamadas POST a la ruta generar en el agente; entradas optimizadas para reconstrucción favoreciendo objetos centrados, fondo blanco e iluminación de estudio lo que redujo artefactos; y un bucle de calidad corto y acotado que calcula métricas de malla como vértices caras y hermeticidad y usa un modelo para puntuar fidelidad semántica y reintentarlo una vez con ajustes si hace falta.
Lecciones sobre ejecutar modelos propios en Cloud Run GPU: los picos de VRAM existen y Zero123++ con LRM pueden dispararlos; limitar tamaños de lote capar resolución usar FP16 y aplicar timeouts fue clave para mantenerse estable en una sola L4. Los arranques en frío son manejables recortando la carga de modelos y simplificando el postprocesado logramos p95 alrededor de 140 segundos con ejecuciones típicas cerca de 90 segundos. Es crítico proteger el camino GPU con IAM para evitar llamadas directas desde el navegador y costos descontrolados.
Ejemplo de uso: prueba un prompt como A medieval fantasy sword with ornate handle centered white background studio lighting para generar una espada detallada, inspecciona la malla en el visor y descarga en GLB OBJ FBX o STL.
Sobre Q2BSTUDIO: Somos Q2BSTUDIO una empresa de desarrollo de software y aplicaciones a medida especializada en inteligencia artificial ciberseguridad y servicios cloud. Diseñamos soluciones de software a medida y aplicaciones a medida para empresas que necesitan integrar agentes IA automatización de procesos y capacidades avanzadas de inteligencia de negocio. Si buscas migrar o optimizar infraestructuras en la nube contamos con experiencia en servicios cloud aws y azure y ofrecemos implementaciones seguras y escalables.
Servicios destacados: consultoría y desarrollo de software a medida implementaciones de IA para empresas creación de agentes IA y soluciones de Business Intelligence con Power BI y servicios de ciberseguridad y pentesting. Descubre nuestras soluciones de nube y despliegues gestionados en Azure y AWS en servicios cloud aws y azure y conoce nuestras capacidades en inteligencia artificial y proyectos de IA para empresas en servicios de inteligencia artificial.
Palabras clave integradas: aplicaciones a medida software a medida inteligencia artificial ciberseguridad servicios cloud aws y azure servicios inteligencia de negocio ia para empresas agentes IA power bi para mejorar el posicionamiento web y conectar el trabajo de innovación con la práctica profesional de Q2BSTUDIO.
Si quieres una demo privada integración personalizada o explorar cómo llevar flujos de trabajo IA y 3D a producción ponte en contacto con nuestro equipo y evaluaremos un plan a medida que incluya seguridad escalabilidad y optimización de costes.
Comentarios