Estudio experimental de dinámicas de entrenamiento en modelo Llama pequeño con presupuesto de tokens
Un estudio experimental muestra que evaluar solo los resultados finales oculta inestabilidad y rendimientos decrecientes en modelos de lenguaje con recursos limitados.