#benchmark osguard

OSGuard: Evaluando la Seguridad de Agentes Informáticos

Descubre OSGuard, el benchmark que evalúa la seguridad de agentes de IA en tareas de computación, detectando acciones inseguras incluso si cumplen el objetivo.

2026-06-16 · 2 min

OSGuard: Benchmark de seguridad para agentes informáticos

Descubre OSGuard, el nuevo benchmark que evalúa la seguridad de los agentes de IA en tareas informáticas. ¿Logran evitar atajos inseguros? Lee más.

2026-06-16 · 2 min