Por qué los estudiantes DMD son perezosos? Entendiendo el copiado en destilación
Descubre por qué los estudiantes DMD copian al maestro en la destilación de pocos pasos. Un fenómeno emergente en alta dimensión que desafía las expectativas.
Descubre por qué los estudiantes DMD copian al maestro en la destilación de pocos pasos. Un fenómeno emergente en alta dimensión que desafía las expectativas.
Descubre cómo DiffusionRank usa modelos generativos de difusión para mejorar el aprendizaje por ranking en recuperación de información, superando métodos tradicionales.
Descubre BlockGen: combina difusión uniforme y enmascarada con muestreo híbrido para generar secuencias por bloques de alta calidad. Supera modelos previos.
IDLM acelera modelos de lenguaje de difusión hasta 64x sin perder calidad. Optimiza la generación de texto con destilación inversa. ¡Descubre más!
GUARD: mitigación quirúrgica de memorización en difusión texto-imagen sin sacrificar calidad. Protege privacidad y evita infracciones de copyright.
Edición perceptual de bajo nivel en difusión incondicional. Mejora imágenes sin reentrenar con parcheo de cuello de botella y guía libre de clasificador.
Descubre SAGE, un nuevo método de reordenamiento que mejora la robustez de los planificadores de difusión mediante autosupervisión y energías, sin necesidad de reentrenamiento.
Aprende a entrenar modelos de difusión descentralizados con objetivos heterogéneos, reduciendo 16x cómputo y 14x datos con una sola GPU. ¡Acelera tu IA!
Descubre DyLLM, un marco de inferencia sin entrenamiento que acelera hasta 9.6x los LLMs de difusión seleccionando solo tokens relevantes. Ideal para razonamiento y código.
ES-Merging fusiona modelos multimodales biológicos usando señales de embedding, mejorando razonamiento cruzado y preservación.
Descubre Genie 4D: transforma grabaciones de móvil en modelos de mundo 4D semánticos y accionables. Reconstrucción interactiva en GPU consumidor.
Políticas de orden adaptativo mejoran generación de secuencias en difusión enmascarada, superando heurísticas en tareas sensibles al orden como proteínas.
Descubre GLENS, un método que usa modelos de difusión para generar inicializaciones diversas y de alta calidad, acelerando la convergencia en optimización no convexa.
Descubre Grounded Decoding, un método sin entrenamiento que fusiona probabilidades para mejorar la precisión factual en sistemas RAG. Resultados superiores en ALCE, NQ y FActScore.
Descubre cómo SA-Merging fusiona modelos de IA usando saliencia para evitar interferencias y mejorar el rendimiento multitarea. Optimiza tus modelos sin datos adicionales.
La inicialización con potencial de guía (DivIn) mejora la diversidad en modelos generativos. Superior en difusión y flujo matching.
Descubre SimSD: un método de decodificación especulativa para modelos de difusión que acelera la inferencia hasta 7.46x sin sacrificar calidad.
Predice la calidad de tus prompts con EMoE: incertidumbre sin entrenamiento en difusión texto-imagen.
Descubre cómo las Políticas de Difusión Parametrizadas (PDP) transforman el ruido en control, adaptando comportamientos robóticos sin reentrenar el modelo. Resu
Agrega señales débiles de pares de modelos para mejorar LLMs potentes con fusión LoRA y alineación geométrica. Mejora razonamiento y búsqueda.