Cache-to-Cache: Comunicación Semántica Directa entre Modelos de Lenguaje Grandes Optimización de modelos de lenguaje grandes mediante comunicación directa entre cachés para mejorar el rendimiento. 2026-03-04 · 2 min