MIPT-SSM: Escalando modelos de lenguaje con $O(1)$ de caché de inferencia a través de transiciones de fase
Optimización de modelos de lenguaje para una inferencia eficiente con una caché $O(1) en escalamiento, mejorando la velocidad y rendimiento del procesamiento del lenguaje natural.