Una perspectiva unificada sobre la dinámica de Transformers profundos Descubre cómo la dinámica de atención en Transformers profundos se modela con ecuaciones Vlasov, revelando clustering y evolución de tokens. 2026-06-19 · 2 min