NAtS-L: Búsqueda de Atención Neuronal para Modelos Híbridos por Token Descubre cómo NAtS-L optimiza transformers combinando atención lineal y softmax por token, reduciendo coste sin perder expresividad en contextos largos. 2026-06-03 · 2 min