BareWave: TTS nativo de forma de onda con Flow-Matching
BareWave es un sistema TTS nativo de onda que elimina representaciones intermedias. Ofrece clonación de voz con inteligibilidad y naturalidad. Escucha demos.
BareWave es un sistema TTS nativo de onda que elimina representaciones intermedias. Ofrece clonación de voz con inteligibilidad y naturalidad. Escucha demos.
Descubre WavSLM, un modelo de lenguaje de habla que aprende sin texto, usando destilación de WavLM para generar voz coherente con menos parámetros y datos.
Aprende a construir un pipeline de IA para voz en video con Node.js y Flutter. Ahorra horas, reduce costos y escala tu contenido automáticamente.
Ex-Omni genera animación facial 3D sincronizada con voz para modelos omni-modales. Código abierto, baja latencia y alta calidad.
UniVoice: un modelo unificado para generación de voz y canto. Logra PER de 5.26% en habla y 16.22% en canto, superando a sistemas dedicados. ¡Descúbrelo!