Enmascaramiento de tokens basado en divergencia KL de entropía: un enfoque novedoso para el ajuste fino selectivo de modelos de lenguaje grandes
Optimiza LLMs con enmascaramiento de tokens y divergencia KL. Técnica de ajuste fino selectivo para mejorar eficiencia y rendimiento en modelos de lenguaje grandes.