#explicadores de activación

Descifrando engaños ocultos en LLMs de razonamiento

STATEWITNESS: explicador de activación para detectar engaños en LLMs de razonamiento. Alta precisión y auditoría transparente.