Compress then Merge: cómo fusionar LoRAs en un único adaptador
Descubre cómo fusionar múltiples LoRAs en un solo adaptador de bajo rango con Compress-then-Merge, mejorando eficiencia y rendimiento sin perder estructura.
Descubre cómo fusionar múltiples LoRAs en un solo adaptador de bajo rango con Compress-then-Merge, mejorando eficiencia y rendimiento sin perder estructura.
Corrige sesgo espectral en operadores neuronales usando difusión posterior y observaciones dispersas, logrando predicciones precisas con solo un 5% de cobertura.
Aprende a combinar LoRAs sin entrenamiento con ponderación por prompt para lograr composiciones de múltiples conceptos con alta fidelidad.
Nuevo marco de aproximación cuantitativa mejora la destilación de flujo en difusión, reduciendo errores hasta 51.9% con particiones no uniformes.
Descubre cómo la IA predice la difusión de conceptos en ciencia usando computación cuántica. Un estudio revela patrones clave para anticipar cambios.
Descubre DiffUNet², un modelo de difusión bidireccional que genera múltiples escenarios científicos y permite exploración visual interactiva de hipótesis.
DRAN se adapta dinámicamente a cambios en distribuciones y relaciones espacio-temporales, superando métodos tradicionales en predicción de tráfico y clima. ¡Mejora tus pronósticos!
Descubre cómo CL-DMDF mejora la fusión de datos multimodales con aprendizaje contrastivo y atención adaptativa, superando la falta de modalidades.
Descubre SDIR: elimina desenfoque y alucinaciones en nowcasting con refinamiento espectral-desacoplado. Alta precisión y fidelidad.
Descubre cómo calibrar señales multimodales antes de fusionarlas mejora el rendimiento en reconocimiento de emociones, detección de eventos y más.
Conoce AVTrack, el dataset que desafía los métodos actuales de seguimiento audiovisual en escenas humanas complejas con oclusiones y movimiento.
Descubre EntangleCodec, el tokenizador de audio que unifica semántica y acústica. Mejora la comprensión de audio en un 7.4% y escala desde 0.6B a 8B parámetros, superando modelos mucho más grandes.
El reward hacking en difusión proviene de la estimación finita de la función h. Proponemos una corrección sin costo y aclaramos el best-of-n.
Fast-dLLM++ acelera inferencia de LLM difusivos sin modificar modelo, aprovechando confianza heterogénea para lograr 37% más rendimiento sin perder precisión.
Mejora la precisión del grounding en videos egocéntricos con fusión de trayectorias de mano. Resultados en Ego4D: +4.32% en consultas de cantidad/estado.
Un modelo compacto de percepción autónoma que integra múltiples sensores y aprendizaje balanceado para lograr mayor eficiencia y velocidad de inferencia.
Prior Guidance (PG) y FMPG: mejora modelos puente de traducción de imágenes sin entrenamiento, usando guía previa y modulación de frecuencias. Ideal para inpainting.
Acelera tus simulaciones atomísticas con GFFMERGE, la fusión eficiente de modelos GNN. Logra hasta 27x de velocidad sin reentrenamiento.
Red neuronal de grafos multimodal con difusión guiada por Transformer mejora la clasificación del Alzheimer preclínico mediante regiones cerebrales clave.
Descubre AugMask: entrena modelos de difusión en datos tabulares incompletos con aumento estocástico. Mejora la generación de datos.