Completación de Matrices Distribucionales de Bajo Rango
Descubre cómo completar matrices de distribuciones de probabilidad usando técnicas de bajo rango y embeddings kernel. Un nuevo enfoque con garantías estadísticas.
Descubre cómo completar matrices de distribuciones de probabilidad usando técnicas de bajo rango y embeddings kernel. Un nuevo enfoque con garantías estadísticas.
Descubre LimiX-2M, un modelo de 2M parámetros que supera a alternativas más grandes mediante tokenización avanzada y enrutamiento optimizado. Reduce costos y mejora precisión en datos tabulares.
Descubre cómo el decaimiento de bajo rango (LRD) acelera el grokking en transformers invariantes a escala, comprimiendo valores singulares.
Descubre SDPLR+: resuelve SDP con millones de variables usando límites de suboptimalidad y bajo rango. Más rápido y escalable.
Descubre cómo el nuevo modelo FacRNN desenreda dinámicas neuronales latentes para una interpretabilidad sin precedentes en neurociencia computacional.
Descubre cómo medir el rol de cada codificador en modelos VLM multicodificador. Capacidad y Necesidad revelan pares óptimos para entrenar sin acumular. Investigación con 16 benchmarks.
Descubre cómo LoRA-MCL genera múltiples continuaciones de texto diversas y relevantes usando adaptadores de bajo rango. Ideal para subtitulado y traducción.
Los signos de pesos inicializados persisten y crean un cuello de botella en compresión sub-bit. Descubre la teoría de bloqueo de signos y un nuevo método.
Algoritmo SNMPBB: gradiente no monótono para NMF simétrica. 6x más rápido que alternativas y superior en clustering de grafos. ¡Optimiza!
DiffBCP combina descomposición tensorial bayesiana y modelos de difusión para reconstruir datos corruptos. Ideal para inpainting y denoising de imágenes.
DiffBCP combina descomposición tensorial bayesiana y modelos de difusión para reconstruir datos severamente corruptos. Ideal para inpainting y denoising de alta resolución.
Descubre cómo fusionar múltiples LoRAs en un solo adaptador de bajo rango con Compress-then-Merge, mejorando eficiencia y rendimiento sin perder estructura.
Descubre cómo StiefAttention comprime el caché KV con aproximación de rango bajo en la variedad de Stiefel, mejorando precisión y eficiencia en modelos de lenguaje.
Descubre cómo SALAAD reduce el consumo de memoria en modelos de lenguaje grandes usando estructuras dispersas y de bajo rango, permitiendo un despliegue flexible sin reentrenamiento.
FlexRank extrae submodelos de capacidad variable de modelos sin reentrenar. Optimiza costos y rendimiento para despliegue adaptativo a todo presupuesto.
Aproxima divergencias-f con estadísticos de rango. Método rank-statistic para alta dimensión usando proyecciones aleatorias. Eficiente y validado.
OP-LoRA mejora el rendimiento de LoRA al añadir MLP temporal que se descarta. Logra hasta 15 puntos más en generación de imágenes.
Descubre RefLoRA, una nueva técnica de fine-tuning que acelera la convergencia y mejora el rendimiento de modelos grandes con mínimo costo computacional.
Descubre cómo LRAgent comparte eficientemente la caché KV entre agentes Multi-LoRA, reduciendo memoria y cómputo sin perder precisión. ¡Optimiza tus LLMs!
Descubre cómo LASER logra una aceleración 2.3x en modelos visión-lenguaje con baja precisión, usando SVD consciente de pérdida y asignación de rango.