Whisfusion: Decodificación ASR Paralela con Difusión Enmascarada
Whisfusion revoluciona la transcripción ASR con decodificación paralela usando difusión enmascarada, superando a Whisper en precisión y velocidad hasta 5x.
Whisfusion revoluciona la transcripción ASR con decodificación paralela usando difusión enmascarada, superando a Whisper en precisión y velocidad hasta 5x.
Descubre cómo MobilityGen, un modelo generativo basado en difusión, simula patrones de movilidad humana realistas y analiza el acceso urbano y la segregación social.
Optimiza la generación de imágenes por IA con enrutamiento consciente del coste. Equilibra calidad y recursos en modelos de difusión. ¡Descubre cómo!
Descubre MMD Guidance, método sin entrenamiento que alinea modelos de difusión con datos de referencia y discrepancia máxima media. Ideal para pocos ejemplos.
El método TS-LFO elude defensas de copyright en modelos de difusión con optimización latente en dos etapas, superando a DiffPure, GrIDPure e IMPRESS.
Descubre cómo OGAS mejora el entrenamiento de sustitutos PDE al enfocarse en casos difíciles, reduciendo errores extremos y dispersión sin sobrecarga computacional.
Los tokens FSQ son óptimos para difusión continua en datos categóricos. Este estudio demuestra que superan a modelos LLM en TTS siendo más pequeños y rápidos.
Descubre cómo las redes neuronales sheaf temporales mejoran la predicción de enlaces en grafos con evolución temporal, usando marcos ortogonales dinámicos y transporte local.
BiWM: framework open-source con autorregresión bidireccional para modelos de video. Reduce etapas de entrenamiento y ofrece control realista de cámara.
Descubre cómo un nuevo método permite editar el tiempo en videos generados por IA, controlando velocidad y estructura sin rediseñar el modelo.
Descubre cómo SteinDiff resuelve la trampa de contractividad en ODEs de difusión, mejorando la calidad de generación sin muestras de referencia
Descubre cómo las PINN mantienen un 91% de precisión frente al 36% de las Diferencias Finitas bajo ruido en 3D, superando las limitaciones clásicas.
Descubre cómo el análisis con wavelets revela los atributos clave de los datos en modelos de difusión. Un enfoque interpretable para la función score.
Descubre cómo una parametrización wavelet del score revela la influencia de las arquitecturas en modelos de difusión. Análisis basado en momentos.
Descubre por qué los datos sintéticos en salud pueden ser engañosos. Un estudio revela fallos en la evaluación actual y propone un marco multidimensional.
Descubre cómo la autocoherencia en modelos generativos mejora la calidad y detecta fallos. Aprende el principio de control residual para optimizar tu IA.
Descubre cómo el nuevo algoritmo TL-HFD mejora la agrupación en hipergrafos con difusión local y umbral, superando al método HFD en ruido.
Descubre cuándo los modelos de score locales extrapolan correctamente a sistemas más grandes. Teoría, diagnóstico y benchmark FDLF para estabilidad en generación científica.
Aprende cómo el índice ICR permite evaluar representaciones y generación en modelos de difusión, detectando memorización temprana sin datos externos.
Descubre cómo LoFlexMDM mejora la generación de secuencias moleculares aprendiendo la dinámica de orden, logrando hasta un 17.5% más de calidad.