StreamMemBench: Evaluación de memoria de agentes para asistencia futura
Descubre StreamMemBench, un benchmark que evalúa cómo los agentes de IA usan observaciones y feedback para asistencia futura. ¿Reutilizan bien la información?
Descubre StreamMemBench, un benchmark que evalúa cómo los agentes de IA usan observaciones y feedback para asistencia futura. ¿Reutilizan bien la información?