#modelos de lenguaje de audio

SpectCount: conteo espectrotemporal con señales sintéticas

Descubre cómo SpectCount usa señales sintéticas para mejorar la comprensión auditiva de modelos de audio grandes, superando debilidades perceptuales con datos eficientes.

2026-06-08 · 1 min

Alineación de señales acústicas en modelos de audio para emociones

Descubre cómo la alineación de señales acústicas mejora el reconocimiento de emociones en modelos de lenguaje de audio. Resultados en FAU-Aibo e IEMOCAP.

2026-06-08 · 2 min

EntangleCodec: Tokenizador de Audio Unificado con Entrelazamiento Semántico-Acústico

Descubre EntangleCodec, el tokenizador de audio que unifica semántica y acústica. Mejora la comprensión de audio en un 7.4% y escala desde 0.6B a 8B parámetros, superando modelos mucho más grandes.

2026-06-03 · 3 min