Estudio comparativo de modelos Transformer para ASR del Corán
Este estudio comparativo de modelos Transformer preentrenados para ASR coránico logra un WER de 0.08, superando en 5% al baseline Citrinet. Aprende las claves.
Este estudio comparativo de modelos Transformer preentrenados para ASR coránico logra un WER de 0.08, superando en 5% al baseline Citrinet. Aprende las claves.
Descubre cómo técnicas de aumento de datos como SRM y PM mejoran el reconocimiento automático del habla disártrica con Wav2Vec2. Resultados prometedores.
¿Los modelos auto-supervisados como wav2vec2.0 compensan el contexto tonal? Un estudio revela que no, a diferencia de modelos ajustados para ASR. Lee más.