Generación de RIR con modelo acústico neuronal y contexto geométrico
Descubre MiNAF: contexto geométrico explícito para generar RIR de alta fidelidad y mejorar la simulación de sonido.
Descubre MiNAF: contexto geométrico explícito para generar RIR de alta fidelidad y mejorar la simulación de sonido.
Descubre cómo un modelo de transformer identifica canciones en un solo paso, superando el reconocimiento acústico tradicional con menos almacenamiento y mayor
Descubre L-Proto, un método que reduce la influencia del idioma en la verificación de locutores, mejorando la precisión entre idiomas. Resultados superiores en
Un estudio revela que los cachalotes tienen un doble nivel: ritmos de clics forman codas, y estas se combinan en secuencias. ¿Estructura similar al lenguaje?
Descubre cómo los LLMs generan verdad fundamental sintética para clasificar emociones en audio VR. Supera limitaciones de etiquetado manual. ¡Descúbrelo!
Descubre cómo pseudoetiquetado y embeddings Whisper logran 75% de precisión en detección de confianza del hablante, mejorando el feedback educativo.
Descubre cómo la combinación de pseudoetiquetado y embeddings de Whisper alcanza un 75% de precisión detectando confianza en el habla. Ideal para educación.
Descubre cómo los modelos de audio espacial basados en IA confunden la codificación de fase mediante texturas de interferencia. Un estudio psicoacústico revela
Ningún modelo bioacústico lo captura todo. Descubre qué rasgos del habla codifica cada uno y cómo elegir según tu tarea.
Descubre cómo un atacante puede distorsionar mapas de explicación en modelos de detección de deepfakes de audio sin alterar la predicción. Un nuevo estudio revela vulnerabilidades en XAI.
Descubre cómo PULSE, un clasificador bioacústico semisupervisado, supera a modelos generales en la identificación de cantos de ortópteros, mejorando el monitoreo ecológico.
GetNetUPAM y ARPA-N: validación cruzada reduce en 10x falsos positivos en bioacústica marina, incluso en entornos ruidosos.
La personalidad percibida varía según el contexto laboral. El estrés afecta al neuroticismo; la acústica predice rasgos en roles diádicos.
DHAuDS es un benchmark de audio dinámico y heterogéneo que expone las debilidades reales de los modelos TTA frente a ruido realista. Ideal para investigadores.
Descubre cómo planificar espacios de oficina que potencien el bienestar, la neurodiversidad y la productividad con diseños flexibles e inclusivos.
Mejora la robustez de asistentes de voz con IRAF: un módulo que adapta la fusión de audio para filtrar interferencias y optimizar diálogos full-dúplex.
IRAF mejora la robustez de diálogos full-dúplex frente a interferencias. Descubre cómo la fusión adaptativa optimiza la interacción natural.
HybridCodec unifica dos paradigmas para codecs de audio: separa semántica y acústica con doble flujo, logrando 3x más velocidad y robustez en entornos multi-idioma.
Descubre cómo la alineación de señales acústicas mejora el reconocimiento de emociones en modelos de lenguaje de audio. Resultados en FAU-Aibo e IEMOCAP.
Nuevo marco de evaluación para detección acústica distribuida (DAS) con OTDR y asistencia Sagnac. Modelo de fusión dual alcanza 89.79% de precisión. Código abierto disponible.