Seguridad adaptativa: activar conciencia latente en modelos de razonamiento Descubre cómo los modelos de razonamiento activan su conciencia de seguridad latente con SFT y DPO, reduciendo ataques hasta un 36%. 2026-06-16 · 2 min