#acústica

Generación de RIR con modelo acústico neuronal y contexto geométrico

Descubre MiNAF: contexto geométrico explícito para generar RIR de alta fidelidad y mejorar la simulación de sonido.

2026-06-17 · 2 min

Identificación musical con una red neuronal en un solo paso

Descubre cómo un modelo de transformer identifica canciones en un solo paso, superando el reconocimiento acústico tradicional con menos almacenamiento y mayor

2026-06-17 · 1 min

L-Proto: Entrenamiento Prototípico para Verificación Multilingüe de Locutores

Descubre L-Proto, un método que reduce la influencia del idioma en la verificación de locutores, mejorando la precisión entre idiomas. Resultados superiores en

2026-06-17 · 2 min

Ritmo profundo: Prueba computacional de dualidad en codas de cachalotes

Un estudio revela que los cachalotes tienen un doble nivel: ritmos de clics forman codas, y estas se combinan en secuencias. ¿Estructura similar al lenguaje?

2026-06-16 · 3 min

Síntesis de verdad fundamental con LLMs e ICL para emociones en audio

Descubre cómo los LLMs generan verdad fundamental sintética para clasificar emociones en audio VR. Supera limitaciones de etiquetado manual. ¡Descúbrelo!

2026-06-16 · 2 min

Detección de confianza en el habla: pseudoetiquetado y embeddings de Whisper

Descubre cómo pseudoetiquetado y embeddings Whisper logran 75% de precisión en detección de confianza del hablante, mejorando el feedback educativo.

2026-06-16 · 2 min

Detección semisupervisada de confianza en habla con Whisper

Descubre cómo la combinación de pseudoetiquetado y embeddings de Whisper alcanza un 75% de precisión detectando confianza en el habla. Ideal para educación.

2026-06-16 · 2 min

Interferencia espectro-temporal en modelos de audio espacial

Descubre cómo los modelos de audio espacial basados en IA confunden la codificación de fase mediante texturas de interferencia. Un estudio psicoacústico revela

2026-06-16 · 2 min

Más que rendimiento: decodificando embeddings bioacústicos con habla

Ningún modelo bioacústico lo captura todo. Descubre qué rasgos del habla codifica cada uno y cómo elegir según tu tarea.

2026-06-15 · 3 min

Fragilidad de explicaciones en modelos de audio: manipulación de atribuciones

Descubre cómo un atacante puede distorsionar mapas de explicación en modelos de detección de deepfakes de audio sin alterar la predicción. Un nuevo estudio revela vulnerabilidades en XAI.

2026-06-15 · 2 min

Decodificando cantos: clasificador bioacústico semisupervisado de ortópteros

Descubre cómo PULSE, un clasificador bioacústico semisupervisado, supera a modelos generales en la identificación de cantos de ortópteros, mejorando el monitoreo ecológico.

2026-06-12 · 1 min

GetNetUPAM: Validación Cruzada y Atención Robusta para Bioacústica Marina

GetNetUPAM y ARPA-N: validación cruzada reduce en 10x falsos positivos en bioacústica marina, incluso en entornos ruidosos.

2026-06-12 · 3 min

Evaluación de personalidad en interacciones laborales diádicas

La personalidad percibida varía según el contexto laboral. El estrés afecta al neuroticismo; la acústica predice rasgos en roles diádicos.

2026-06-10 · 2 min

DHAuDS: Benchmark dinámico y heterogéneo para adaptación en pruebas

DHAuDS es un benchmark de audio dinámico y heterogéneo que expone las debilidades reales de los modelos TTA frente a ruido realista. Ideal para investigadores.

2026-06-09 · 2 min

Factores esenciales para necesidades y planificación de espacios

Descubre cómo planificar espacios de oficina que potencien el bienestar, la neurodiversidad y la productividad con diseños flexibles e inclusivos.

2026-06-09 · 2 min

IRAF: Fusión Adaptativa Resistente a Interferencias para Diálogo Full-Dúplex

Mejora la robustez de asistentes de voz con IRAF: un módulo que adapta la fusión de audio para filtrar interferencias y optimizar diálogos full-dúplex.

2026-06-08 · 1 min

IRAF: Fusión Adaptativa Resiliente a Interferencias para Diálogos Full-Dúplex

IRAF mejora la robustez de diálogos full-dúplex frente a interferencias. Descubre cómo la fusión adaptativa optimiza la interacción natural.

2026-06-08 · 2 min

HybridCodec: Codec Neural de Doble Flujo con Semántica Mejorada

HybridCodec unifica dos paradigmas para codecs de audio: separa semántica y acústica con doble flujo, logrando 3x más velocidad y robustez en entornos multi-idioma.

2026-06-08 · 2 min

Alineación de señales acústicas en modelos de audio para emociones

Descubre cómo la alineación de señales acústicas mejora el reconocimiento de emociones en modelos de lenguaje de audio. Resultados en FAU-Aibo e IEMOCAP.

2026-06-08 · 2 min

Benchmark para detección acústica distribuida con OTDR y Sagnac

Nuevo marco de evaluación para detección acústica distribuida (DAS) con OTDR y asistencia Sagnac. Modelo de fusión dual alcanza 89.79% de precisión. Código abierto disponible.

2026-06-06 · 2 min