dLLM-Cache: Caché Adaptativa para Modelos de Lenguaje con Difusión
dLLM-Cache acelera hasta 9x modelos de difusión con caché adaptativa, sin entrenamiento y con latencia cercana a modelos autoregresivos.
dLLM-Cache acelera hasta 9x modelos de difusión con caché adaptativa, sin entrenamiento y con latencia cercana a modelos autoregresivos.
Cómo adaptadores ligeros entrenados en pares vector-etiqueta logran autointerpretación que supera etiquetas y revela razonamiento implícito.
Reduce correlaciones espurias con un método de dos etapas basado en memorización. Solo 10% de datos, un modelo ERM supera a técnicas de debiasing ¡Descúbrelo!
Descubre cómo las redes neuronales aprenden representaciones espectrales de grupos, convergencia demostrable a irreducibles y compresión de bajo rango.
Descubre cómo la Destilación de Confusión (CD) mejora el aprendizaje de modelos sin profesor, superando a otros métodos en CIFAR-100.
Analizamos el aprendizaje de características en destilación de conocimiento y presentamos Confusion Distillation, una auto-destilación eficiente que supera a otros métodos en 1.2%.
Descubre LiNO, operador neural inspirado en luz que separa modulación local y comunicación global con eficiencia cuadrática a lineal. Ideal para PDEs paramétricas.
Descubre cómo la granularidad temporal afecta la inferencia sociodemográfica y el equilibrio privacidad-utilidad en medidores inteligentes. Estudio con 1589 hogares.
Estudio revela que la resolución temporal de los perfiles de carga influye en la inferencia de datos personales del hogar, con mesetas de rendimiento y métodos óptimos.
Reveal-IG: atribución basada en caminos distribucionales. Atribuciones estables con signo sin artefactos. Ideal para explicabilidad en IA.
El modelo TransGAN-WT combina Transformer y GAN para detectar anomalías en turbinas eólicas con F1 del 96.1% y FPR del 0.06%. Optimiza el mantenimiento predictivo.
QUIVER incorpora vistas cuántico-informadas para mejorar representaciones en grandes modelos de ML, ofreciendo mejoras medibles en QM9 y JetClass.
Descubre cómo la dimensión del modelo establece los límites geométricos para la representación de características en transformers, y cómo estimar la capacidad real de direcciones ortogonales.
Mejora la precisión del grounding en videos egocéntricos con fusión de trayectorias de mano. Resultados en Ego4D: +4.32% en consultas de cantidad/estado.
La cuantización no destruye todas las características interpretables: un análisis revela que el 62% persiste en INT6, pero las métricas engañan.
Conoce las funcionalidades de una app: escalabilidad, integración, automatización y seguridad. Reemplaza hojas de cálculo con Q2BSTUDIO.
Descubre cómo el aprendizaje espectral consciente del resultado mejora la regresión IV incluso con desalineación espectral.
Descubre cómo la IA explicable revela neuronas activadas por la ausencia de conceptos y mejora la eliminación de sesgos en modelos profundos.
Descubre cómo el nuevo modelo bayesiano P-SMGP mejora la clasificación de señales EEG en BCI, reduciendo costos computacionales y ofreciendo interpretabilidad.
Descubre cómo la regularización implícita mejora la selección de características en problemas multi-etiqueta, reduciendo sesgo y permitiendo un sobreajuste beni