SIFT: Índice selectivo para acelerar prefill de RAG con invarianza de atención Descubre cómo SIFT optimiza el prefill de RAG usando índices selectivos de atención, acelerando el TTFT hasta 1.71x con precisión casi perfecta. 2026-06-09 · 2 min