Stable-GFlowNet: Hacia un red-teaming diverso y robusto de LLM mediante el equilibrio de trayectorias contrastivas
Descubre cómo el red-teaming diverso y robusto de modelos de lenguaje grandes con Stable-GFlowNet mejora la seguridad y el rendimiento de los LLM.