Almieyar-Oryx-BloomBench: Evaluación cognitiva bilingüe de VLMs BloomBench: el primer benchmark bilingüe para evaluar cognitivamente modelos de visión-lenguaje. Asimetrías clave entre árabe e inglés. 2026-06-05 · 2 min