MAVL: Dataset multilingüe audio-video para traducción de canciones animadas
MAVL es un benchmark multilingüe multimodal para traducir canciones animadas. SylAVL-CoT usa audio-video y restricciones silábicas para letras cantables.
MAVL es un benchmark multilingüe multimodal para traducir canciones animadas. SylAVL-CoT usa audio-video y restricciones silábicas para letras cantables.
PEACE integra LLM y control de vuelo seguro para drones. Descubre cómo mejora la planificación, reduce riesgos y costos de IA.
Descubre DeMaVLA, el modelo VLA fundacional que logra manipular objetos deformables como ropa en entornos domésticos, aprendiendo de datos reales y corrección de errores.