#difusión

FAIR-Calib: Calibración consciente de fronteras para LLMs de difusión

Descubre FAIR-Calib, un novedoso método de calibración que reduce errores en la cuantificación de modelos de lenguaje de difusión, mejorando estabilidad y precisión.

2026-06-08 · 1 min

Inserción de objetos 3D con control de pose mediante DIRECT

Descubre DIRECT, el innovador marco que permite insertar objetos en imágenes con control preciso de su pose 3D, manteniendo alta fidelidad visual y adaptación al fondo.

2026-06-08 · 3 min

ChronoForest: Planificación de rutas con difusión y múltiples árboles

ChronoForest utiliza difusión y árboles múltiples para planificar rutas largas, alcanzando 99.8% de éxito en búsqueda de puentes y composición.

2026-06-08 · 2 min

Destilación on-policy para transformar modelos autoregresivos en difusivos

Descubre cómo OPDLM transforma modelos autoregresivos en difusivos con destilación on-policy, reduciendo tokens de entrenamiento hasta 7000x sin perder rendimiento.

2026-06-08 · 1 min

MotionEnhancer: difusión video mejora modelos visión-lenguaje en movimiento

Descubre cómo MotionEnhancer usa difusión de video para mejorar la comprensión del movimiento en VLMs, sin parámetros adicionales.

2026-06-08 · 2 min

EgoPressDiff: Difusión de Video Multimodal para Presión Manual

Descubre EgoPressDiff, un marco de difusión multimodal que estima presión manual con un 34% más de precisión, ideal para AR/VR.

2026-06-08 · 2 min

Dinámicas de rechazo paso a paso en modelos autoregresivos y de difusión

Estudio revela que modelos de difusión son más robustos ante jailbreaks que los autoregresivos. Conoce el nuevo detector SRI.

2026-06-08 · 2 min

CountsDiff: modelo de difusión para generación e imputación de datos de recuento

CountsDiff revoluciona la generación e imputación de datos de recuento con un modelo de difusión para números naturales. Supera a métodos líderes en scRNA-seq. ¡Descubre cómo!

2026-06-08 · 3 min

Imputación espacio-temporal con flujo guiado por grafos

Descubre GiFlow: imputación espacio-temporal con flujo guiado por grafos. Supera a los métodos tradicionales en eficiencia y precisión.

2026-06-08 · 1 min

Recuperación de redes de cascada con Jacobiano corregido

CascadeNet: nuevo método de aprendizaje automático que recupera redes de influencia oculta a partir de datos de cascada, sin necesidad de modelos de difusión pr

2026-06-08 · 3 min

Corrector Langevin Consistente con Medidas para Estabilizar Solvers LDM

Descubre cómo el corrector Langevin consistente con medidas (MCLC) estabiliza los solvers de problemas inversos en difusión latente, mejorando la fiabilidad.

2026-06-08 · 1 min

CascadeNet: recuperación de redes en cascada con ML insesgado

CascadeNet usa ML y Jacobiano para recuperar redes de influencia ocultas en datos en cascada, con validación en COVID-19.

2026-06-08 · 2 min

TrioPose: generación de imágenes guiada por pose con transformers

TrioPose mejora un 30% la precisión en generación de imágenes con pose usando transformers de triple flujo. Ideal para escenas con múltiples personas.

2026-06-08 · 2 min

Entropía como prior estructural impulsa diversidad y desarrollo musical

Descubre cómo la entropía como prior estructural evita el colapso del modo y mejora la diversidad y desarrollo musical en modelos de difusión con LoRA.

2026-06-08 · 2 min

TargetSEC: Conversión de Emoción del Habla con Difusión Latente

TargetSEC: conversión de emociones en voz con difusión latente. Preserva identidad y supera a otros sistemas en precisión.

2026-06-08 · 2 min

Generalización de modelos de difusión con espacio de representación equilibrado

Descubre cómo los modelos de difusión generalizan con representaciones equilibradas. Detecta memorización y edita sin entrenamiento.

2026-06-08 · 2 min

Generación unificada de canciones y conversión de voz cantada con acompañamiento

Descubre UniSinger, el primer modelo de IA que unifica generación de canciones y SVC con acompañamiento. Clonación de voz y sinergia vocal-acompañamiento.

2026-06-08 · 2 min

MAGE: El bloque All-[MASK] sabe dónde mirar en difusión por bloques LLM

Con MAGE, la atención dispersa acelera hasta 6.82x la inferencia en contexto largo sin pérdida de precisión.

2026-06-08 · 2 min

STREAM: Flujo Riemanniano para generación de imágenes histopatológicas

STREAM: nuevo método de flujo riemanniano para generar imágenes histopatológicas. Supera colapso de condicionamiento y logra SOTA.

2026-06-08 · 2 min

Homotopía Gaussiana Probabilística: continuación para optimización no convexa

PGH es un marco de continuación probabilístico que sesga gradientes hacia mínimos globales en optimización no convexa. Ideal para IA y datos dispersos.

2026-06-08 · 2 min