
IndexTTS2: Análisis del modelo de síntesis emocional más potente de 2025
IndexTTS2 es un modelo TTS autoregresivo de Bilibili que ofrece control de duración en milisegundos, clonación de voz zero-shot y entrada multimodal para doblaje, audiolibros y localización multilingüe.