Modelado de Contexto Largo con Arquitectura Híbrida GSS-Transformer La Arquitectura Híbrida Paralela GSS-Transformer supera el tradeoff eficiencia-perplejidad: 16.51 PPL con 24% más rendimiento. 2026-06-16 · 2 min