MURMUR: Sistema eficiente de inferencia para ASR de larga duración Murmur: sistema de inferencia para ASR de larga duración que reduce la latencia 4.2x sin degradar la precisión. Atención dispersa y evicción de caché KV. 2026-06-02 · 3 min