#wav2vec2

Estudio comparativo de modelos Transformer para ASR del Corán

Este estudio comparativo de modelos Transformer preentrenados para ASR coránico logra un WER de 0.08, superando en 5% al baseline Citrinet. Aprende las claves.

2026-06-19 · 3 min

Cómo mejorar el reconocimiento de voz disártrica con aumento de datos

Descubre cómo técnicas de aumento de datos como SRM y PM mejoran el reconocimiento automático del habla disártrica con Wav2Vec2. Resultados prometedores.

2026-06-19 · 2 min

Compensación perceptual del contexto tonal en modelos de habla auto-supervisados

¿Los modelos auto-supervisados como wav2vec2.0 compensan el contexto tonal? Un estudio revela que no, a diferencia de modelos ajustados para ASR. Lee más.

2026-06-17 · 2 min