Atención Verificable Eficiente en Comunicación para Inferencia de LLM Acelera la inferencia de LLM con VeriAttn: atención verificable y eficiente en comunicación, reduciendo carga TEE y mejorando rendimiento hasta 5.42x. 2026-06-16 · 1 min