GenTSE: Extracción de Voz Objetivo con Modelo Generativo
GenTSE: modelo generativo en dos etapas para extraer la voz objetivo con alta calidad. Supera a sistemas previos en inteligibilidad y consistencia. Entrenamiento con DPO alinea la salida perceptual.