MAVL: Dataset multilingüe audio-video para traducción de canciones animadas
MAVL es un benchmark multilingüe multimodal para traducir canciones animadas. SylAVL-CoT usa audio-video y restricciones silábicas para letras cantables.
MAVL es un benchmark multilingüe multimodal para traducir canciones animadas. SylAVL-CoT usa audio-video y restricciones silábicas para letras cantables.
MTAVG-Bench 2.0 evalúa y diagnostica fallos de expresividad cinematográfica en audio-video multi-hablante. Herramienta clave para análisis de interpretación y calidad audiovisual.