Atención Dispersa Estocástica para Inferencia Limitada por Memoria Optimiza la inferencia con atención dispersa estocástica: reduce el uso de memoria sin sacrificar rendimiento. Técnica eficiente para modelos de lenguaje. 2026-05-05 · 2 min