#difusión

¿Quién debe liderar la decodificación? Trayectorias fiables para ensamblar MDLMs

TIE: nuevo método para combinar modelos de difusión enmascarados usando trayectorias de decodificación seguras. Mejora razonamiento y generación.

2026-06-16 · 3 min

Entrenamiento y evaluación de políticas de difusión con contextos largos

¿Sabías que escalar la longitud del contexto no es tan frágil como se pensaba? Este estudio explora el entrenamiento de políticas de difusión con contextos

2026-06-16 · 3 min

Entrenamiento y evaluación de políticas de difusión con longitudes de contexto largas

Escalar la longitud de contexto en políticas de difusión no es frágil. Nuevo benchmark y algoritmo de entrenamiento conjunto reducen complejidad muestral.

2026-06-16 · 2 min

Rápido cuándo, Cuidadoso quién: Toma de turnos multipartes con difusión

Aprende cómo un nuevo modelo de dos etapas optimiza la toma de turnos en diálogos multipartes usando aumento por difusión para decisiones rápidas y precisas.

2026-06-16 · 2 min

Gen-VCoT: Razonamiento visual con cadena de pensamiento generativa

Descubre Gen-VCoT, un nuevo marco de razonamiento visual que usa imágenes RGB intermedias generadas por difusión para mejorar la interpretabilidad y precisión

2026-06-16 · 2 min

Deep Q-Learning en espacios de Hölder

Descubre cómo el Q-learning en espacios de Hölder mejora la regularidad y eficiencia. Arquitectura DeepONet.

2026-06-16 · 2 min

Decodificación revocable guiada por tokens ancla en LLMs de difusión

Descubre ASRD, un framework sin entrenamiento que mejora la precisión hasta un 6.4% y acelera la inferencia 7.2x en LLMs de difusión usando tokens ancla.

2026-06-16 · 2 min

Seguridad computacional para IA generativa: perspectiva de pruebas de hipótesis

Descubre cómo la seguridad computacional en IA generativa usa pruebas de hipótesis para detectar prompts maliciosos y contenido generado.

2026-06-16 · 2 min

BridgePolicy: Políticas visomotoras con difusión basada en observaciones

BridgePolicy: política visomotora que integra observaciones en dinámica de difusión para control robótico. Supera métodos en 52 simulaciones y 5 tareas reales.

2026-06-16 · 3 min

Muestreo Adaptativo por Regiones para Transformers de Difusión

Descubre RAS: Muestreo adaptativo para Transformers de Difusión que acelera la generación de imágenes hasta 2.5x sin pérdida de calidad.

2026-06-16 · 2 min

Aprendizaje de distribuciones de permutaciones mediante difusión en rangos suaves

Soft-Rank Diffusion: método de difusión suave para aprender permutaciones. Mejora el rendimiento en ordenamiento y optimización combinatoria.

2026-06-16 · 1 min

RL eficiente para razonamiento visual-textual con difusión discreta

Descubre cómo la difusión discreta reduce un 26.9% el cómputo en razonamiento visual-textual y la recompensa factorizada mejora un 11.2% el rendimiento.

2026-06-16 · 2 min

QPILOTS: Guiado eficiente en tiempo de prueba para políticas de flujo

QPILOTS mejora el rendimiento de políticas de flujo en tiempo de prueba sin modificar el modelo, alcanzando un 90% de éxito en 50 tareas. Descubre cómo.

2026-06-16 · 2 min

Detección de anomalías por reconstrucción con prompting visual y doble maestro

Descubre cómo el prompting visual y doble maestro mejoran la detección de anomalías superando limitaciones de escala, fondo e iluminación. +3.5% en AeBAD.

2026-06-16 · 2 min

AHA-WAM: Modelado Asíncrono de Mundo-Acción con Enrutamiento de Contexto

AHA-WAM: el modelo asíncrono de mundo-acción que alcanza un 92.8% de éxito en robótica sin preentrenamiento. ¡Control en tiempo real a 24 Hz!

2026-06-16 · 2 min

PTL-Diffusion: Difusión consciente de variedades con leyes terminales periódicas

PTL-Diffusion mejora generación en variedades con leyes periódicas. Descubre cómo reduce errores de covarianza y distancia en benchmarks.

2026-06-16 · 2 min

CineOrchestra: control unificado para video cinematográfico

Descubre CineOrchestra, el modelo que integra control de sujetos, eventos, cámaras y transiciones para generar videos cinematográficos de alta fidelidad.

2026-06-15 · 1 min

HiLo-Token: Compresión adaptativa de tokens para edición eficiente de imágenes

Descubre HiLo-Token, un método que acelera hasta 3x la edición de imágenes con IA sin perder calidad. Optimiza tokens según frecuencia espacial.

2026-06-15 · 2 min

Acondicionamiento: estabilizando inversión y atención en edición de imágenes

SimEdit mejora la edición de imágenes con difusión mediante refinamiento de condicionamiento y control de atención. Mayor precisión y preservación del fondo.

2026-06-15 · 2 min

Condicionamiento: Estabilizando Inversión y Atención en Edición de Imágenes

SimEdit mejora la edición de imágenes por difusión con condicionamiento preciso y control de atención, logrando estabilidad y fidelidad.

2026-06-15 · 1 min