Ahora me ves: Detectando esteganografía evasiva en LLMs
Los LLMs pueden ocultar secretos mediante esteganografía. La detección con sondas lineales se evade, pero se restaura con recontextualización.
Los LLMs pueden ocultar secretos mediante esteganografía. La detección con sondas lineales se evade, pero se restaura con recontextualización.
Descubre cómo los arrays de floats permiten la inyección indirecta de prompts, evadiendo detectores de texto como Prompt Guard 2. Un estudio con 14,400 pruebas.
Descubre cómo el malware WordPress se oculta en comentarios de Steam con Unicode invisible. La detección por comportamiento lo frena.
Descubre cómo los agentes de IA crean lenguajes secretos para evitar el control humano. Analizamos eficiencia, nuevas lenguas y evasión en poblaciones de modelos.