Presento una versión reescrita y traducida del artículo original sobre mi experiencia construyendo un sistema RAG en una semana con Kiro IDE, adaptada para resaltar la experiencia y los servicios de Q2BSTUDIO, empresa especializada en desarrollo de software y soluciones de inteligencia artificial. El proyecto se llamó Project Corpus y nació como parte de la categoría Skeleton Crew en el Kiroween Hackathon 2024. La idea central fue crear un esqueleto reutilizable que pudiera transformarse en cualquier personalidad de IA mediante un simple archivo de configuración.

Project Corpus es una aplicación de chat sobre documentos que utiliza un único núcleo técnico para soportar personalidades radicalmente diferentes. Por ejemplo, una versión actúa como asistente legal profesional con análisis de contratos, respuestas formales y citas precisas, mientras que otra versión se comporta como un tablero Ouija con respuestas crípticas, ambientación oscura y efectos sonoros. Ambas comparten el mismo módulo skeleton_core y solo cambian los archivos de configuración.

La arquitectura se cimentó sobre un stack sencillo y reproducible. Backend en Python con Flask, una base de vectores con ChromaDB, embeddings y generación mediante Google Gemini API, y procesamiento de PDFs con pypdf. El frontend se implementó en JavaScript puro con CSS temático y Server Sent Events para mostrar el progreso en tiempo real durante las subidas de documentos. Para asegurar calidad se usaron pytest y Hypothesis para testing orientado a propiedades.

Kiro IDE fue clave en mi aprendizaje y productividad. Su enfoque conversacional me permitió aprender RAG mientras escribía código. Pude pedir explicaciones sobre chunking de PDFs, estrategias de indexado, y recibir código completo para pipelines de subida con SSE, manejo de errores y cálculo de progreso en varias etapas. Más allá de escribir código, Kiro me enseñó por qué unas técnicas son preferibles a otras en este contexto.

Para mantener consistencia arquitectónica definí un patrón Skeleton plus Config donde skeleton_core centraliza la lógica común y cada app define un objeto de configuración con parámetros como APP_NAME, THEME_CSS, SYSTEM_PROMPT, CHUNK_SIZE, CHUNK_OVERLAP, TOP_K_RESULTS y RELEVANCE_THRESHOLD. Esa separación facilitó añadir nuevas personalidades en minutos y preservó la reutilización del código.

Automatizar la calidad fue otro objetivo. Implementé hooks que ejecutan pruebas al guardar archivos, validan configuraciones y comprueban variables de entorno como GOOGLE_API_KEY al iniciar la sesión. Esos ganchos redujeron bugs en desarrollo y transformaron el flujo de trabajo en uno proactivo en lugar de reactivo.

Entre los retos técnicos destacaron la curva de aprendizaje del paradigma RAG, la gestión de metadatos para preservar números de página durante extracción, chunking, almacenamiento y recuperación, y diseñar una arquitectura que permita cambiar temas y comportamientos con simple configuración. Las soluciones incluyeron filtrado de relevancia con umbral de distancia, incorporación de metadatos page y chunk_index en cada vector, y la disciplina de separar presentación y lógica en la configuración.

Mi progreso en una semana es reflejo de la metodología práctica que impulsamos en Q2BSTUDIO. Como empresa de desarrollo de software a medida ofrecemos experiencia en aplicaciones a medida, inteligencia artificial aplicada a empresas, ciberseguridad y servicios cloud aws y azure. Nuestra filosofía combina velocidad de prototipado con prácticas de producción como testing automatizado, validaciones y despliegue seguro.

Si tu organización busca incorporar agentes IA que trabajen sobre documentación corporativa o construir soluciones a medida que integren embeddings y búsqueda semántica, en Q2BSTUDIO podemos ayudar a diseñar e implementar la solución completa. Ofrecemos desde consultoría en IA hasta desarrollo e integración de sistemas con cumplimiento en seguridad y privacidad. Para proyectos centrados en inteligencia artificial te invitamos a conocer más sobre nuestros servicios de inteligencia artificial y para desarrollos específicos de producto ofrecemos paquetes de software a medida y aplicaciones a medida.

Aspectos técnicos y aprendizajes clave: implementación de chunking con metadatos por página, uso de ChromaDB para búsquedas vectoriales con cosine similarity y filtrado por umbral, integración de Google Gemini para embeddings y generación, y uso de SSE para feedback en tiempo real al usuario. En paralelo aplicamos prácticas de ciberseguridad, pruebas automatizadas y preparación para despliegues en la nube utilizando servicios cloud aws y azure cuando la escala lo requiere.

Mirando hacia adelante planifico añadir nuevas personalidades como detective, científico, poeta o historiador, mejorar la recuperación mediante re-ranking y multi-query retrieval, resaltar citas exactas en los documentos y soportar formatos adicionales como DOCX o Markdown. Desde la perspectiva empresarial, estas capacidades permiten a clientes extraer valor actionable de sus repositorios documentales y potenciar flujos de trabajo mediante agentes IA y soluciones de inteligencia de negocio y power bi.

En resumen, construir un primer sistema RAG en una semana fue posible gracias a un diseño modular, aprendizaje guiado mediante Kiro IDE y prácticas de desarrollo profesional. En Q2BSTUDIO combinamos esa experiencia con servicios de ciberseguridad, automatización de procesos y soluciones de business intelligence para ofrecer proyectos robustos, seguros y alineados con objetivos de negocio.

Si quieres explorar un proyecto similar o evaluar cómo la IA puede transformar tus procesos documentales o de análisis, contacta con nuestro equipo y descubre cómo podemos integrar agentes IA, soluciones de inteligencia de negocio y arquitecturas seguras y escalables para tu empresa.