iOSWorld: Benchmark de agentes telefónicos inteligentes personalizados
Descubre iOSWorld, el primer benchmark interactivo para agentes inteligentes en iOS con identidad persistente. Evalúa modelos en tareas de una y múltiples apps. Resultados: hasta 52% de acierto.