KV-Fold: Recurrencia de caché KV de un paso para inferencia de contexto largo
<meta name=description content=KV-Fold recurrencia en un paso de caché KV para inferencia de contexto largo. Optimiza el rendimiento de modelos de lenguaje con contextos extensos.>