#acciones inseguras

OSGuard: Evaluando la Seguridad de Agentes Informáticos

Descubre OSGuard, el benchmark que evalúa la seguridad de agentes de IA en tareas de computación, detectando acciones inseguras incluso si cumplen el objetivo.

2026-06-16 · 2 min

AICompanionBench: Evaluando la seguridad en asistentes de IA

Conoce AICompanionBench, benchmark público de conversaciones IA-humanas para evaluar seguridad en asistentes como Replika. Análisis de 20 LLMs.

2026-06-04 · 1 min