StressDream: Evaluación robusta de políticas con modelos de video
StressDream optimiza el ruido de modelos de video para generar futuros plausibles y críticos. Evalúa y mejora políticas robóticas identificando fallos.
StressDream optimiza el ruido de modelos de video para generar futuros plausibles y críticos. Evalúa y mejora políticas robóticas identificando fallos.
Descubre cómo los modelos de difusión de video con tokenización de malla permiten un control preciso del movimiento humano en 3D, eliminando la necesidad de ren
Descubre DarkVesselNet: fusión de SAR, óptico y AIS con IA para detectar barcos oscuros. Razonamiento de trayectorias y detección de anomalías.
Descubre cómo VRPO mejora el alineamiento de representaciones en difusores mediante optimización por refuerzo, logrando +1.8 FID y 2.3x más rápido que REPA.
Descubre cómo optimizar modelos de video Wan2.2 con destilación y cuantización de baja precisión. ¡Mejor calidad, menos pasos!
Descubre EPIC, un framework que acelera inferencia paralela con CFG en modelos de difusión, reduciendo tiempo 67.5% y overhead 90.5%.
WaveFilter mejora el rendimiento de LLMs de difusión en contexto largo mediante filtrado guiado por wavelets del caché KV.
Descubre cómo DASH comprime modelos de difusión manteniendo calidad y guía, superando al entrenamiento desde cero.
Descubre cómo MLLM-Microscope analiza las representaciones internas de los MLLMs, revelando linealidad, dimensión y anisotropía para mejorar el diseño futuro.
SISA: nuevo híbrido SSM-atención. Logra 17.3% en LAMBADA y recuperación perfecta en NIAH 7x más rápida que Transformers. ¡Descúbrelo!
TrustLDM revela vulnerabilidades en modelos de difusión de lenguaje. Seguridad, privacidad y equidad analizadas.
Descubre TCAR-Gen, un nuevo marco que combina redes neuronales de grafos, fusión temporal y razonamiento en árbol para responder preguntas complejas sobre casos criminales históricos.
Extrae texto de cientos de PDFs en un solo comando con pdf-toolkit. Procesa lotes, fusiona archivos, extrae páginas y exporta a CSV. Ahorra tiempo.
Descubre cómo NAMEx, basado en teoría de juegos, mejora la colaboración entre expertos en modelos MoE, logrando mayor precisión y robustez en IA.
Descubre cómo los denoisers suavemente restringidos mejoran el cumplimiento de EDPs sin rigidizar el modelo. Ideal para física computacional con IA.
Descubre SANA-Streaming: edita video en tiempo real a 1280x704 y 24 FPS en una RTX 5090. Co-diseño sistema-algoritmo con difusión híbrida.
Nuevo modelo de difusión latente con regularización por histograma genera nódulos pulmonares realistas para mejorar diagnóstico del cáncer en TC.
Estudio revela que MDLMs descifran entidades primero en generación texto-gráfico. SFT puede fallar, pero decodificación lambda recupera +9.4 BLEU.
Descubre TunerDiT: método sin entrenamiento para videos multi-evento con transformadores de difusión. Mejora consistencia y separación de eventos.
Descubre DTop-p MoE, un nuevo mecanismo de enrutamiento dinámico que aprende el umbral de probabilidad para controlar la esparcidad, superando a Top-k y Top-p fijo en modelos fundacionales.