El '/goals' de Claude Code separa al agente que trabaja del que decide que ha terminado.

El auge de los agentes autónomos en entornos productivos ha revelado un desafío que va más allá de la capacidad de razonamiento de los modelos subyacentes: el momento en que un agente decide que ha terminado una tarea no siempre coincide con la realidad. En procesos como migraciones de código, corrección de suites de pruebas o limpieza de colas, es frecuente que el agente señale éxito sin haber ejecutado todos los pasos, generando falsos positivos que tardan horas o días en detectarse. La raíz del problema no está en la inteligencia del modelo, sino en la arquitectura de control: el mismo modelo que ejecuta también evalúa, y esa doble función introduce un sesgo de confirmación que lleva a finalizaciones prematuras. La respuesta de los principales laboratorios ha sido separar formalmente el rol de ejecutor del rol de evaluador, una estrategia que Anthropic ha concretado en su funcionalidad /goals para Claude Code. Aquí, tras definir un objetivo medible (por ejemplo, que todos los tests de autenticación pasen y el lint esté limpio), el agente principal trabaja en un bucle, pero cada vez que intenta finalizar, un modelo evaluador independiente (Haiku por defecto) verifica si la condición se cumple. Si no, el agente continúa; si sí, se registra el logro y se limpia el objetivo. Este esquema evita que el agente mezcle lo ya completado con lo pendiente, y no requiere plataformas de observabilidad externas ni scripts de terminación escritos a mano. Enfoques similares existen en LangGraph y Google Agent Development Kit, pero en esos casos el desarrollador debe definir manualmente el nodo crítico y la lógica de terminación. La propuesta de Anthropic simplifica la operativa al incluir el evaluador por defecto, con la opción de ajustar el nivel de exigencia. La separación de roles resulta especialmente relevante para empresas que buscan auditoría y confiabilidad en sus flujos de inteligencia artificial. En lugar de depender de un único modelo que juzga su propio trabajo, se introduce un segundo actor que aplica un criterio objetivo. Este patrón también empieza a aparecer en sistemas de razonamiento y en agentes de codificación como Devin o SWE-agent. Para tareas deterministas con un estado final verificable —como migraciones, limpieza de colas o corrección de tests—, el bucle separado es muy efectivo. Sin embargo, para trabajos que requieren juicio de diseño o matices, la intervención humana sigue siendo insustituible. En este contexto de maduración de los agentes IA hacia sistemas autoconscientes y auditables, contar con un aliado técnico que integre estas capacidades de forma segura y escalable es clave. En Q2BSTUDIO, como empresa de desarrollo de software y tecnología, ofrecemos servicios de inteligencia artificial para empresas que incluyen la orquestación de agentes con evaluadores independientes, así como el diseño de aplicaciones a medida que incorporan estos patrones de verificación. También trabajamos con servicios cloud aws y azure para desplegar infraestructuras robustas, y con ciberseguridad para garantizar que ningún atajo indebido comprometa la integridad del proceso. Nuestro equipo implementa software a medida que aprovecha estas arquitecturas de agente-evaluador, y podemos integrar servicios inteligencia de negocio con power bi para monitorizar en tiempo real el rendimiento de los flujos. La tendencia hacia sistemas más observables y con menor dependencia de reconstrucciones post-mortem es imparable, y separar al que trabaja del que decide que ha terminado es un paso firme en esa dirección.

Compartir

Comentarios