Cribado neurodegenerativo con LLM multimodales unificando acústica y texto
NeurMLLM unifica acústica y texto con LLM multimodales para detectar Alzheimer y Parkinson. Resultados superiores en clasificación de etapas.
NeurMLLM unifica acústica y texto con LLM multimodales para detectar Alzheimer y Parkinson. Resultados superiores en clasificación de etapas.
Descubre cómo las representaciones MFCC superan a los espectrogramas en el diagnóstico de asma y EPOC usando CNN y GRU. Resultados con F1-score de 0.877.
Mejor diagnóstico diferencial de asma y EPOC usando MFCC y redes CNN-GRU. F1-score de 0.877 en evaluación por ciclos. Aumento de datos no mejoró.
Descubre cómo la arquitectura CNN-Transformer logra un 98.1% de precisión en el reconocimiento de emociones en habla árabe, superando a modelos como wav2vec 2.0.
Aprende cómo un modelo deep learning con atención multimodal alcanza 91.5% de precisión detectando Parkinson usando voz.