El patrón Wipe & Inject: Contexto completo para la implementación después de largas sesiones de planificación
El muro de contexto aparece cuando se usa un agente tipo Claude Code para desarrollo serio y la sesión se divide en una fase de planificación larga y una fase de implementación corta. En la fase de planificación se pueden pasar 45 minutos debatiendo arquitectura, pidiendo al agente que lea 20 archivos, compruebe dependencias y diseñe el sistema de autenticación. El coste en tokens puede llegar a 150000 y el resultado es un plan perfecto. Al comenzar la implementación suele ocurrir el choque: el agente responde que necesita compactar su memoria para seguir y pierde parte esencial del contexto.
La solución que muchos usan es artesanal y frágil. Guardar el plan en un archivo .md, pedir al agente que lo lea de nuevo, hacer que reexplore archivos mencionados y actualizar el .md con los avances. Repetir cada vez que el contexto se llena. El problema principal es que al compactar contexto el agente resume el QUÉ pero olvida el PORQUÉ, por ejemplo que se eligieron cookies en lugar de headers por riesgos XSS. El cerebro del agente queda a baja resolución, re-pregunta restricciones y produce código con errores.
Para resolverlo introducimos el patrón Wipe & Inject, también llamado flujo de orquestación Planning CLEAR. En lugar de permitir que la ventana de contexto se llene con idas y venidas, usamos un proxy local que fuerza un reinicio entre Planificación y Codificación. Detectamos el cambio de fase con un modelo ligero que monitoriza la sesión y cuando detecta que task_type pasa de Planning a Implementation dispara el evento CLEAR.
Antes de vaciar la memoria extraemos la señal relevante y la convertimos a JSON con dos campos concretos: Decisiones clave que acordamos, por ejemplo usar Zod para validación, y Rastro de razonamiento que explica por qué se decidió eso, por ejemplo porque Joi no soporta inference de tipos. El Wipe consiste en vaciar completamente el array messages[] dejando 0 tokens usados. El Inject introduce el resumen estructurado directamente en el system_prompt de la nueva sesión.
El resultado es inmediato. Al empezar a escribir código no estás luchando por los últimos 50000 tokens. Dispones de una ventana de contexto fresca de aproximadamente 195000 tokens y el agente conserva recuerdo completo de las restricciones arquitectónicas esenciales. Esto reduce re-preguntas, evita rehacer decisiones y mejora la calidad del código generado.
Además hay otra fricción que resolvimos con un Heartbeat para la expiración de caché. La caché de prompt de algunos proveedores caduca tras 5 minutos de inactividad. Si te levantas 10 minutos para un café la caché se enfría y el siguiente prompt vuelve a costar lectura completa de tokens. La solución es un flag de extended-cache que lanza un keep-alive mínimo cada 4 minutos, literalmente un punto, que mantiene la sesión caliente. El coste es insignificante, aprox 0.002 por keep-alive, y mantiene la sesión lista indefinidamente.
Hicimos estas workflows en Grov, nuestro proxy open source para trabajar con agentes y reducir estos cuellos de botella en proyectos reales. Estas ideas también se integran de forma natural en procesos de desarrollo de software a medida y en soluciones basadas en agentes IA, mejorando la productividad y la seguridad del ciclo de vida de desarrollo.
En Q2BSTUDIO somos especialistas en desarrollo de software, aplicaciones a medida y soluciones de inteligencia artificial para empresas. Ofrecemos servicios de software a medida, ciberseguridad y pentesting, servicios cloud aws y azure, y soluciones de inteligencia de negocio y Power BI. Si buscas potenciar tus proyectos con IA aplicada y agentes inteligentes visita nuestra sección de IA para empresas o conoce cómo desarrollamos aplicaciones a medida que integran seguridad y escalabilidad.
Palabras clave integradas: aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA y power bi. Si quieres optimizar tus sesiones con agentes y evitar el muro de contexto contacta con Q2BSTUDIO y aplicaremos el patrón Wipe & Inject a tu flujo de desarrollo.
Comentarios