#nivel de paso

PolicyGuard: defensa adversarial en tiempo de prueba y por paso para RL

PolicyGuard defiende agentes de RL contra ataques backdoor en tiempo de prueba, usando procesos Gaussianos para detectar anomalías paso a paso. Resultados state-of-the-art.

2026-06-12 · 2 min

Autoencoder Disperso a Nivel de Paso para Interpretar Razonamiento

Descubre cómo el autoencoder disperso a nivel de paso (SSAE) desentraña el razonamiento de los LLMs, revelando información sobre corrección y lógica. Ideal para interpretabilidad en IA.

2026-06-02 · 1 min