#nats-l

NAtS-L: Búsqueda de Atención Neuronal para Modelos Híbridos por Token

Descubre cómo NAtS-L optimiza transformers combinando atención lineal y softmax por token, reduciendo coste sin perder expresividad en contextos largos.

2026-06-03 · 2 min