LKV: Aprendizaje de extremo a extremo de presupuestos por cabeza y selección de tokens para la expulsión de caché KV en LLM
LKV optimiza la expulsión de caché KV en modelos de lenguaje mediante aprendizaje de presupuestos por cabeza y selección dinámica de tokens. Mayor eficiencia y rendimiento.