¡Es una TRAP! Benchmark de persuasión para agentes web
Descubre cómo el benchmark TRAP expone vulnerabilidades críticas en agentes web ante inyecciones de prompt. Hasta 43% de modelos caen en estas trampas.
Descubre cómo el benchmark TRAP expone vulnerabilidades críticas en agentes web ante inyecciones de prompt. Hasta 43% de modelos caen en estas trampas.