WavSLM: Modelado de lenguaje de habla en flujo único mediante destilación de WavLM
Descubre WavSLM, un modelo de lenguaje de habla que aprende sin texto, usando destilación de WavLM para generar voz coherente con menos parámetros y datos.
Descubre WavSLM, un modelo de lenguaje de habla que aprende sin texto, usando destilación de WavLM para generar voz coherente con menos parámetros y datos.
¿Qué pistas usan los detectores de deepfake de voz? Descubre cómo analizan ambiente, fonemas y bordes de palabras para detectar audios falsos. Explicabilidad con IA.