¿Cuándo es dirigible tu LLM?
Predice la dirigibilidad de tu LLM con solo los primeros tokens. Un estudio con 1.4M de ejemplos logra un F1 de 0.7. ¡Optimiza tu steering!
Predice la dirigibilidad de tu LLM con solo los primeros tokens. Un estudio con 1.4M de ejemplos logra un F1 de 0.7. ¡Optimiza tu steering!
Descubre VALUEFLOW, el primer marco unificado para extraer, evaluar y controlar la intensidad de valores en LLMs. Mejora la alineación pluralista.