OSGuard: Evaluando la Seguridad de Agentes Informáticos
Descubre OSGuard, el benchmark que evalúa la seguridad de agentes de IA en tareas de computación, detectando acciones inseguras incluso si cumplen el objetivo.
Descubre OSGuard, el benchmark que evalúa la seguridad de agentes de IA en tareas de computación, detectando acciones inseguras incluso si cumplen el objetivo.
Descubre OSGuard, el nuevo benchmark que evalúa la seguridad de los agentes de IA en tareas informáticas. ¿Logran evitar atajos inseguros? Lee más.