EverydayMMQA: Un marco multilingüe y multimodal para preguntas y respuestas visuales habladas con base cultural
Explora EverydayMMQA, un marco multilingüe y multimodal para preguntas y respuestas visuales habladas con base cultural que integra lenguaje, visión y contexto cultural.