Echo: Diarización y reconocimiento de voz en espacio latente compartido
Echo: un sistema de audio con un encoder ViT que unifica diarización, ASR y separación de fuentes en un espacio latente. Eficiente y preciso.
Echo: un sistema de audio con un encoder ViT que unifica diarización, ASR y separación de fuentes en un espacio latente. Eficiente y preciso.