MyPCBench: un benchmark para agentes inteligentes de uso personal de PC MyPCBench evalúa agentes de IA como asistentes personales en escritorio Linux con 184 tareas reales. El mejor modelo (Claude Opus) solo resuelve 55.4%. 2026-06-16 · 2 min