Agente MCP de Java en Acción: Demo y Resultados

Tras siete entregas desarrollando nuestro cliente Java MCP desde cero, llegó el momento de grabar una demostración para evaluar cómo responde nuestro agente IA ante consultas reales. En este artículo detallo la configuración de la demo, las pruebas realizadas, lo que funcionó, lo que falló y las lecciones aprendidas sobre el comportamiento de agentes IA.

Sobre Q2BSTUDIO: somos Q2BSTUDIO, empresa de desarrollo de software y aplicaciones a medida, especialistas en inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio y soluciones personalizadas para empresas. Diseñamos software a medida y aplicaciones a medida que integran agentes IA, power bi y prácticas de ciberseguridad para ofrecer soluciones completas.

Configuración de la demo: Nuestro JavaChatAI estuvo ejecutándose con tres servidores MCP que ofrecen servicios de FileSystem, Weather y Time, proveedor LLM Groq con modelo Llama, orquestación multi-herramienta completa y tres modos de ejecución configurados: DIRECT_ANSWER, SINGLE_TOOL y MULTI_TOOL. El objetivo fue sencillo: probar distintos tipos de consulta y comprobar la calidad del enrutamiento inteligente.

Prueba 1 Pregunta: ¿Cuál es la capital de Estados Unidos? Comportamiento esperado: DIRECT_ANSWER Resultado observado: DIRECT_ANSWER Respuesta: Washington D C Resultado: PERFECTO El agente identificó correctamente que se trataba de una consulta basada en conocimiento que no necesitaba herramientas externas.

Prueba 2 Pregunta: ¿Qué hora es en Denver CO? Comportamiento esperado: SINGLE_TOOL Resultado observado: SINGLE_TOOL Respuesta: Son las 5 22 PM en Denver Resultado: PERFECTO El agente seleccionó el servidor de hora adecuado y extrajo correctamente el parámetro de ubicación Denver CO. Nuestra lógica de extracción de parámetros y selección de herramienta funciona.

Prueba 3 Pregunta: ¿A qué distancia está Denver CO de Washington DC en avión? Comportamiento esperado: DIRECT_ANSWER Resultado observado: Inicialmente clasificado como MULTI_TOOL El orquestador intentó crear un plan y al no encontrar herramientas apropiadas para calcular distancia, el agente recurrió al conocimiento del LLM Respuesta final: La distancia en vuelo es aproximadamente 1 600 millas 2 575 kilómetros Resultado: SALIDA CORRECTA, PROCESO INCORRECTO El agente sobrefitró la consulta como MULTI_TOOL y, cuando faltaron herramientas, utilizó el LLM. Esto indica que el flujo de decisión puede mejorarse para evitar pasos innecesarios.

Prueba 4 Pregunta: ¿Qué hora es y cómo está el tiempo en Washington DC? Comportamiento esperado: MULTI_TOOL con dos operaciones en paralelo Resultado observado: MULTI_TOOL El plan incluyó herramienta de hora y de clima y además añadió de forma errónea una operación de guardado en fichero Respuesta: Son las 7 22 PM hora del Este El tiempo en Washington DC es actualmente 69°F con probabilidad de chubascos y tormentas Resultado: INFORMACIÓN CORRECTA, SELECCIÓN DE HERRAMIENTA ERRÓNEA El agente obtuvo ambos datos solicitados pero añadió una acción de escritura en disco que no se pidió y efectivamente guardó un archivo en la carpeta del proyecto.

Qué nos dicen los resultados: Lo que funciona Bien La arquitectura base de enrutamiento distingue entre respuestas directas y aquellos casos que requieren herramientas. Para operaciones de una sola herramienta la extracción de parámetros y la invocación son fiables. Esto es clave cuando se diseña software a medida que integra agentes IA con servicios externos.

Qué mejorar Hay una tendencia a sobreclasificar consultas como MULTI_TOOL y a la hallucination de herramientas donde el agente añade pasos no solicitados como guardar archivos. La solución pasa por afinar los prompts de análisis y endurecer los criterios que determinan cuándo una consulta necesita una estrategia multi-herramienta. La ingeniería de prompts y la capa de decisión deben refinarse iterativamente.

Lecciones aprendidas Construir agentes IA es un proceso iterativo. La arquitectura es sólida y la funcionalidad central funciona, pero la capa de inteligencia requiere ajuste continuo. En Q2BSTUDIO aplicamos estos aprendizajes para mejorar nuestras ofertas en inteligencia artificial y crear soluciones robustas para empresas.

Pruébalo tú mismo El código completo de la serie está disponible en GitHub y animamos a que clones el repositorio y ejecutes tus propias pruebas para descubrir comportamientos interesantes. Si buscas desarrollar proyectos personalizados con agentes IA o integrar capacidades avanzadas en tus aplicaciones, visita nuestra página de Desarrollo de aplicaciones a medida y conoce nuestros servicios de inteligencia artificial.

Conclusión La sesión de demostración confirmó que el agente MCP en Java es funcional, resistente y capaz de atender consultas diversas sin caerse, aunque mostró áreas claras de mejora en la toma de decisiones y en la generación de acciones innecesarias. Nuestro equipo en Q2BSTUDIO continúa refinando la capa de inteligencia para ofrecer soluciones de software a medida que integren agentes IA, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA y power bi con la máxima calidad.

Contacto y seguimiento Síguenos para más desarrollos y demos y ponte en contacto si deseas una solución a medida que combine inteligencia artificial, ciberseguridad y servicios cloud.

Compartir

Comentarios

También te puede interesar

Interfaz de chat: de componentes a la conversación

Consultas con LLM: de lenguaje natural a ejecución de herramientas

Poder de LLM para todos: Inferencia segura y rentable

Por qué fallan los agentes de IA en producción y cómo hacerlos fiables

Código con IA por pereza, IA en software es difícil

Camino correcto: IA a medida vs herramientas listas para usar 2025