En este proyecto di un paso fuera de la zona de confort para migrar de Gemini 2.5 a Gemini 3 en Vertex AI con el objetivo de construir un Generador Inteligente de Texto Alternativo para imágenes que vaya más allá de una simple descripción y etiquetas. La aplicación analiza una imagen para generar texto alternativo, hashtags, recomendaciones y hasta encuentra un dato sorprendente u oscuro utilizando la herramienta de Google Search integrada, además de ofrecer el proceso de pensamiento para que los usuarios entiendan la lógica del modelo.

Arquitectura técnica: frontend en Angular v21, backend y lógica de IA en Firebase con Vertex AI, modelo Gemini 3.0 Pro Preview, y servicios de seguridad como Firebase App Check y Firebase Remote Config. La solución devuelve salidas estrictamente estructuradas en JSON, emplea Thinking Mode para visibilidad del razonamiento y usa el llamado a herramientas para grounding mediante búsquedas web.

Arranque y configuración: antes de iniciar la app Angular se carga la configuración del modelo desde Firebase Remote Config usando un initializer que establece valores por defecto como geminiModelName con valor gemini-3-pro-preview, vertexAILocation global, includeThoughts true y thinkingBudget 512. En caso de fallo se aplica el fallback a esos valores por defecto. También se inicializa App Check para proteger la lógica de IA y evitar abusos del backend.

Inyección del modelo generativo: las configuraciones leídas desde Remote Config se usan para construir el modelo Generative AI en Vertex AI. Se especifica responseMimeType application/json y un responseSchema que define el formato esperado con campos para tags, alternativeText, recommendations y fact. Se habilita thinkingConfig para permitir pensamiento y token budget y se añade la herramienta googleSearch en tools para grounding.

Esquema de salida: el JSON estructurado facilita renderizar en la UI. La respuesta contiene tags como array de cadenas, alternativeText como cadena limitada a 125 caracteres, recommendations como lista de sugerencias con id, texto y razón, y un fact que enlaza alguna conexión conceptual u obvia entre etiquetas.

Ingeniería del prompt: para obtener resultados precisos se construye un prompt multi paso que indica tareas concretas al modelo: generar un texto alternativo conciso, producir al menos tres etiquetas, proponer mejoras creativas para la imagen y buscar un dato curioso o enlace conceptual entre etiquetas mediante Google Search. La imagen se convierte a un part aceptado por Vertex AI y se envía junto al prompt.

Procesamiento de la respuesta: tras recibir la respuesta se extrae el pensamiento resumido con thoughtSummary, el texto en bruto que contiene el JSON, se limpia cualquier marcaje, se parsea a objeto JSON y se calcula el uso de tokens desglosado en input, output y thought. Esto permite medir el coste del razonamiento y optimizar el thinkingBudget si es necesario.

Grounding y citas: cuando Gemini 3 realiza búsquedas para encontrar el hecho sorprendente devuelve grounding metadata con groundingSupports y groundingChunks. Un helper itera los índices de soporte para extraer las uris web asociadas y construir una lista de citas que se muestran en la interfaz para comprobar las fuentes, mejorando la trazabilidad y la verificación de la información.

Integración en Angular: en el componente principal la acción de generar llama al servicio FirebaseService que procesa la imagen y actualiza una señal analysis con el resultado. Componentes UI muestran las etiquetas, las sugerencias de búsqueda de Google, el hecho interesante con sus citas y el resumen del pensamiento con el desglose de tokens para transparencia. Esto facilita tanto la experiencia de usuario como el control de costes y auditoría del modelo.

Beneficios de migrar a Gemini 3: Thinking Mode aporta transparencia sobre el razonamiento del modelo y Grounding mediante Google Search mejora la precisión factual, dos capacidades clave para aplicaciones que requieren confianza en la salida de la IA. La salida JSON estructurada facilita el consumo por parte de frontends y sistemas de downstream.

En Q2BSTUDIO aplicamos esta experiencia para ofrecer soluciones de software a medida y aplicaciones a medida que integran inteligencia artificial robusta y segura. Nuestro equipo combina desarrollo de aplicaciones a medida con servicios de inteligencia artificial para empresas, despliegues seguros en la nube y prácticas de ciberseguridad. Si buscas potenciar procesos con IA o desarrollar agentes IA personalizados, podemos ayudarte desde el diseño hasta la puesta en producción.

Servicios y palabras clave: ofrecemos software a medida, aplicaciones a medida, inteligencia artificial para empresas, ciberseguridad, servicios cloud AWS y Azure, servicios de inteligencia de negocio, agentes IA y Power BI. Si tu proyecto requiere desarrollo multiplataforma o soluciones en la nube consulta nuestra propuesta de y descubre cómo podemos acelerar la transformación digital de tu negocio.

Casos de uso: generación automática de texto alternativo accesible para e commerce y catálogos multimedia, mejora semántica de metadatos para SEO, creación de descripciones optimizadas para redes sociales con hashtags relevantes, enriquecimiento de contenidos con hechos verificados y generación de recomendaciones creativas para aumentar la interacción.

Seguridad y despliegue en la nube: implementamos controles como App Check y buenas prácticas de seguridad y ofrecemos despliegues gestionados en plataformas como AWS y Azure. Si te interesa migrar o desplegar modelos y servicios en la nube revisa nuestros servicios cloud en para diseñar la arquitectura que mejor se adapte a tus objetivos.

Conclusión: migrar a Gemini 3 en Vertex AI aportó capacidades de razonamiento explícito y grounding que mejoran la confianza y utilidad del Generador de Texto Alternativo. En Q2BSTUDIO combinamos estas tecnologías con experiencia en ciberseguridad, inteligencia de negocio y desarrollo a medida para ofrecer soluciones integrales. Si buscas una solución que combine IA explicable, calidad de datos y despliegue seguro, nuestro equipo está listo para acompañarte.

Palabras clave aplicaciones a medida software a medida inteligencia artificial ciberseguridad servicios cloud aws y azure servicios inteligencia de negocio ia para empresas agentes IA power bi