#audio-video

MAVL: Dataset multilingüe audio-video para traducción de canciones animadas

MAVL es un benchmark multilingüe multimodal para traducir canciones animadas. SylAVL-CoT usa audio-video y restricciones silábicas para letras cantables.

2026-06-02 · 2 min

MTAVG-Bench 2.0: Diagnóstico de modos de fallo de la expresividad cinematográfica en la generación de audio-video con múltiples hablantes.

MTAVG-Bench 2.0 evalúa y diagnostica fallos de expresividad cinematográfica en audio-video multi-hablante. Herramienta clave para análisis de interpretación y calidad audiovisual.

2026-05-29 · 2 min