Exploración de diseño de superposición granular de cómputo y comunicación basada en DMA La superposición granular de cómputo y comunicación con DMA acelera hasta 1.6x el entrenamiento ML en GPUs. Heurísticas precisas para elegir el plan óptimo. 2026-06-02 · 2 min