ViTaPEs: Codificaciones de posición visuotáctiles para la alineación entre modalidades en transformadores multimodales
<meta name="description" content=Alineación multimodal que integra visión y tacto mediante codificaciones visuotáctiles para mejorar la percepción artificial y la interacción inteligente>