Alineación de características determina estrategia de fusión multimodal La alineación de características, no el tamaño de datos, determina la fusión: cross-attention vs concatenación. Estudio con CLIP y ResNet. 2026-06-02 · 2 min