#fusión

Compress then Merge: cómo fusionar LoRAs en un único adaptador

Descubre cómo fusionar múltiples LoRAs en un solo adaptador de bajo rango con Compress-then-Merge, mejorando eficiencia y rendimiento sin perder estructura.

2026-06-03 · 3 min

Corrigiendo el sesgo espectral en operadores neurales con difusión posterior

Corrige sesgo espectral en operadores neuronales usando difusión posterior y observaciones dispersas, logrando predicciones precisas con solo un 5% de cobertura.

2026-06-03 · 3 min

Composición LoRA multiconcepto sin entrenamiento con ponderación por prompt

Aprende a combinar LoRAs sin entrenamiento con ponderación por prompt para lograr composiciones de múltiples conceptos con alta fidelidad.

2026-06-03 · 3 min

Aproximación cuantitativa para destilación de flujo en difusión

Nuevo marco de aproximación cuantitativa mejora la destilación de flujo en difusión, reduciendo errores hasta 51.9% con particiones no uniformes.

2026-06-03 · 2 min

Predicción de difusión conceptual en ciencia: caso computación cuántica

Descubre cómo la IA predice la difusión de conceptos en ciencia usando computación cuántica. Un estudio revela patrones clave para anticipar cambios.

2026-06-03 · 2 min

DiffUNet²: predicción bidireccional y generación probabilística para datos científicos

Descubre DiffUNet², un modelo de difusión bidireccional que genera múltiples escenarios científicos y permite exploración visual interactiva de hipótesis.

2026-06-03 · 3 min

DRAN: Red Adaptativa de Distribución y Relaciones Espacio-Temporales

DRAN se adapta dinámicamente a cambios en distribuciones y relaciones espacio-temporales, superando métodos tradicionales en predicción de tráfico y clima. ¡Mejora tus pronósticos!

2026-06-03 · 2 min

CL-DMDF: Fusión Dinámica de Datos Multimodales con Aprendizaje Contrastivo

Descubre cómo CL-DMDF mejora la fusión de datos multimodales con aprendizaje contrastivo y atención adaptativa, superando la falta de modalidades.

2026-06-03 · 2 min

Refinamiento iterativo espectral-desacoplado para predicción de precipitaciones

Descubre SDIR: elimina desenfoque y alucinaciones en nowcasting con refinamiento espectral-desacoplado. Alta precisión y fidelidad.

2026-06-03 · 2 min

Calibración contextual multimodal: qué conservar antes de fusionar

Descubre cómo calibrar señales multimodales antes de fusionarlas mejora el rendimiento en reconocimiento de emociones, detección de eventos y más.

2026-06-03 · 3 min

AVTrack: Seguimiento Audiovisual en Escenas Humanas Complejas

Conoce AVTrack, el dataset que desafía los métodos actuales de seguimiento audiovisual en escenas humanas complejas con oclusiones y movimiento.

2026-06-03 · 1 min

EntangleCodec: Tokenizador de Audio Unificado con Entrelazamiento Semántico-Acústico

Descubre EntangleCodec, el tokenizador de audio que unifica semántica y acústica. Mejora la comprensión de audio en un 7.4% y escala desde 0.6B a 8B parámetros, superando modelos mucho más grandes.

2026-06-03 · 3 min

Guía por recompensa en modelos de flujo y difusión: ¿realmente inclinamos?

El reward hacking en difusión proviene de la estimación finita de la función h. Proponemos una corrección sin costo y aclaramos el best-of-n.

2026-06-03 · 3 min

Fast-dLLM++: Perfil Fréchet para Inferencia más Rápida de LLM Difusión

Fast-dLLM++ acelera inferencia de LLM difusivos sin modificar modelo, aprovechando confianza heterogénea para lograr 37% más rendimiento sin perder precisión.

2026-06-03 · 2 min

Fusión de trayectoria de mano para consultas NLQ egocéntricas

Mejora la precisión del grounding en videos egocéntricos con fusión de trayectorias de mano. Resultados en Ego4D: +4.32% en consultas de cantidad/estado.

2026-06-03 · 2 min

Percepción autónoma compacta con aprendizaje balanceado y fusión multisensor

Un modelo compacto de percepción autónoma que integra múltiples sensores y aprendizaje balanceado para lograr mayor eficiencia y velocidad de inferencia.

2026-06-03 · 2 min

GuidedBridge: Mejora de modelos puente sin entrenamiento con guía previa

Prior Guidance (PG) y FMPG: mejora modelos puente de traducción de imágenes sin entrenamiento, usando guía previa y modulación de frecuencias. Ideal para inpainting.

2026-06-03 · 2 min

GFFMERGE: Fusión eficiente de campos de fuerza con GNN

Acelera tus simulaciones atomísticas con GFFMERGE, la fusión eficiente de modelos GNN. Logra hasta 27x de velocidad sin reentrenamiento.

2026-06-03 · 3 min

Red Neuronal de Grafos Multimodal para Clasificación de Alzheimer Preclínico

Red neuronal de grafos multimodal con difusión guiada por Transformer mejora la clasificación del Alzheimer preclínico mediante regiones cerebrales clave.

2026-06-03 · 2 min

AugMask: entrenamiento de modelos de difusión con datos tabulares incompletos

Descubre AugMask: entrena modelos de difusión en datos tabulares incompletos con aumento estocástico. Mejora la generación de datos.

2026-06-03 · 2 min