PMB: Memoria local-first para Claude, Cursor y Codex - 94.5% recall
La memoria de los agentes de inteligencia artificial ha sido históricamente uno de los puntos débiles en la interacción prolongada. Cuando conversamos con un asistente basado en modelos de lenguaje, al día siguiente todo parece haberse borrado. Las soluciones comerciales ofrecen capas de memoria en la nube, pero implican enviar datos sensibles a servidores externos, lo que no siempre es aceptable para equipos que priorizan la privacidad o trabajan con software a medida que maneja información crítica. En este contexto surge PMB (Personal Memory Brain), un servidor MCP de código abierto que proporciona memoria persistente local-first para agentes como Claude, Cursor o Codex, alcanzando un 94.5% de recall en el benchmark LoCoMo sin necesidad de APIs externas. PMB ejecuta todo en la máquina del usuario, combinando SQLite y LanceDB, y logra latencias de 70ms en solicitudes cálidas. Detrás de este rendimiento hay técnicas ingeniosas como el reranking consciente de predicados (PAMVR), expansión multilingüe de verbos, extracción de hechos atómicos sin LLM y división de consultas compuestas con fusión RRF. La arquitectura está diseñada para evitar la pérdida de datos incluso en fallos del proceso, mediante una cola de embedding asíncrona con persistencia en SQLite. En Q2BSTUDIO, como empresa especializada en ia para empresas, entendemos que la capacidad de retener contexto a largo plazo es clave para agentes IA realmente útiles. Soluciones como PMB permiten que los asistentes recuerden decisiones técnicas, configuraciones de proyectos o preferencias personales durante meses, sin depender de servicios cloud que incrementen la complejidad y los costes. Esto se alinea con nuestra filosofía de ofrecer aplicaciones a medida que respeten la soberanía de los datos, combinando inteligencia artificial con ciberseguridad y servicios cloud aws y azure cuando sea necesario, pero sin comprometer la privacidad. PMB demuestra que es posible competir con sistemas centralizados usando únicamente recursos locales y técnicas de recuperación de información bien diseñadas. Para empresas que desarrollan software a medida con agentes IA, integrar un sistema de memoria como PMB puede marcar la diferencia entre un asistente que 'olvida' constantemente y uno que realmente entiende el contexto del negocio. En Q2BSTUDIO también trabajamos con servicios inteligencia de negocio y power bi, donde la memoria contextual puede ayudar a que los asistentes recuerden preferencias de visualización o consultas previas. El artículo original detalla cinco técnicas clave que llevaron a este rendimiento, todas reproducibles desde el repositorio. La primera, PAMVR, aplica reglas como coincidencia de entidades, verbos y vocabulario de dominio, logrando mejorar el recall en 5 puntos. La expansión de sinónimos verbales añadió 8 puntos adicionales en consultas con intención malinterpretada. La extracción de hechos atómicos sin LLM, mediante expresiones regulares, supuso un salto de 15 puntos en mensajes con múltiples datos. La división de consultas compuestas con fusión RRF elevó un 12% el acierto en preguntas dobles. Finalmente, la cola de embedding asíncrona garantiza cero pérdidas de datos sin bloquear la escritura. Todo el código está en GitHub bajo licencia Apache 2.0. En Q2BSTUDIO, creemos que el futuro de la IA empresarial pasa por soluciones híbridas que combinen lo mejor del cloud y lo local, y PMB es un excelente ejemplo de cómo la inteligencia artificial puede ser potente y respetuosa con la privacidad a la vez. Si tu equipo desarrolla aplicaciones a medida o necesita integrar agentes IA con memoria persistente, te invitamos a explorar cómo podemos ayudarte desde nuestra experiencia en software a medida y servicios cloud gestionados. La memoria local-first no es solo una tendencia, es una necesidad para quienes valoran el control de sus datos.
Comentarios