Una encuesta sobre la comprensión de documentos visualmente ricos basada en MLLM: Métodos, desafíos y tendencias emergentes
Encuesta para entender la comprensión de documentos visualmente ricos utilizando modelos de lenguaje y aprendizaje automático. ¡Participa y ayúdanos a mejorar la interacción con contenido multimedia!