No seas tan Stief: optimización de KV Cache en la variedad de Stiefel Descubre cómo StiefAttention comprime el caché KV con aproximación de rango bajo en la variedad de Stiefel, mejorando precisión y eficiencia en modelos de lenguaje. 2026-06-03 · 2 min