NeST: Ajuste Selectivo de Neuronas para Seguridad en LLMs
Descubre NeST, un método de alineación de seguridad para LLMs que reduce ataques de jailbreak del 44.5% al 1.1% con solo 0.4M parámetros.
Descubre NeST, un método de alineación de seguridad para LLMs que reduce ataques de jailbreak del 44.5% al 1.1% con solo 0.4M parámetros.