Más allá de la difusión: Autorregresión jerárquica para reconstrucción fMRI
MindHier supera a la difusión en reconstrucción de imágenes desde fMRI: es 4.67x más rápido y más preciso gracias a su autorregresión jerárquica.
MindHier supera a la difusión en reconstrucción de imágenes desde fMRI: es 4.67x más rápido y más preciso gracias a su autorregresión jerárquica.
Descubre OpenVTON-Bench, el nuevo benchmark con 100K imágenes de alta resolución para evaluar probadores virtuales con métrica multimodal fiable.
Descubre por qué falla la optimización directa en la inversión del sistema Gray-Scott y cómo los componentes PINN evitan este problema. Análisis del paisaje de pérdida.
Descubre LAPG: difusión guiada por mínima acción para extrapolación física, reduciendo deriva y preservando dinámicas.
Descubre cómo Flow Matching con priors contextuales genera dinámicas cerebrales realistas en tareas nunca vistas, impulsando la neurociencia contrafactual.
Descubre cómo Reverse Flow Matching unifica métodos de difusión y flujo en RL online, mejorando la eficiencia y estabilidad del entrenamiento con Q-learning.
Descubre cómo FOCUS optimiza la inferencia de DLLMs, enfocando el cómputo en tokens decodables para lograr hasta 3.5x más rendimiento sin pérdida de calidad.
Descubre cómo el método NSG-VD usa principios físicos para detectar videos generados por IA con un 16% más de Recall que los métodos actuales.
Generación de actividad cerebral con flow matching para tareas cognitivas nunca vistas. Un avance en neurociencia contrafactual.
Descubre cómo los modelos de difusión aprenden estadísticas simples primero y luego las complejas, según una nueva teoría con implicaciones para la generación de imágenes.
¿El remasking por confianza mejora los modelos de difusión enmascarados? Un estudio revela que sus beneficios son limitados y dependen del contexto.
Descubre cómo cuantizar Ideogram 4.0 a INT8 y GGUF para GPUs Ampere, manteniendo la calidad FP8 y mejorando el rendimiento.
Descubre cómo tres intervenciones mejoran la decodificación especulativa, aumentando la longitud de secuencia aceptada hasta un 76% con modelos de difusión.
Descubre Adv-TGD, el nuevo ataque adversarial que engaña sistemas de reconocimiento facial con 85.9% de éxito y alta calidad visual.
Argus revoluciona la generación de video preservando la identidad del sujeto mediante un innovador mosaico multivista dinámico. ¡Descubre cómo!
Descubre AnchorEdit, el primer framework autoregresivo de difusión para edición de imágenes multitorneo que mantiene la identidad del sujeto sin errores acumulados, incluso tras 10 rondas de edición.
Descubre cómo combinar calibración táctil Real2Sim y políticas de difusión para lograr agarre ciego en manos robóticas reales, sin visión ni demostraciones. Resultados: 27% de éxito.
Diff-prior mejora la inferencia de estructuras con un prior adaptativo de difusión que calibra distribuciones inciertas para decisiones más claras.
InDex adapta modelos VLA a manos diestras sin perder generalización. Logra manipulación diestra con pocos datos usando fine-tuning condicionado por intención.
¿Problemas de precisión en robótica? AGRA alinea representaciones visuales con acciones, mejorando localización y robustez. ¡Descubre cómo!