#reconocimiento de habla

Pensamiento Continuo de Audio para Grandes Modelos de Lenguaje

Descubre cómo CoAT permite a los modelos de audio retener información acústica mediante un espacio latente continuo, mejorando transcripción y clasificación.

2026-06-18 · 1 min

MuVAP: Modelo multimodal para predicción de turnos en conversaciones

Descubre MuVAP, el modelo que predice quién hablará usando solo audio y una cámara. Ideal para robots sociales. Más preciso que los modelos actuales.

2026-06-16 · 2 min