Repensando descomposiciones tensoriales en compresión post-entrenamiento de LLMs
Descubre por qué descomposiciones tensoriales tienen limitaciones en la compresión de LLMs y cómo afectan a modelos densos y MoE. Análisis teórico y práctico.
Descubre por qué descomposiciones tensoriales tienen limitaciones en la compresión de LLMs y cómo afectan a modelos densos y MoE. Análisis teórico y práctico.
¿Aprenden los LLM a representar el modelo del mundo al planificar? Este análisis revela cómo el ajuste supervisado codifica la validez de acciones y predicados.
Formalizamos el problema de vinculación en visión artificial. Mide la información de vinculación en Vision Transformers para mejorar el reconocimiento.
Nueva técnica: coherencia geométrica para interpretar redes neuronales. Aplicaciones en BERT y autoencoders.
Descubre cómo las redes neuronales aprenden representaciones espectrales de grupos, convergencia demostrable a irreducibles y compresión de bajo rango.
Hidden-Align alinea estados ocultos en modelos de lenguaje, mejorando el razonamiento matemático hasta un 6.2% en benchmarks. Técnica innovadora de RL.
Descubre cómo IdEst, basado en dimensión intrínseca, evalúa representaciones SSL de forma eficiente, reduciendo costos computacionales y sin necesidad de etiquetas.
IdEst evalúa representaciones SSL con dimensión intrínseca: métrica geométrica que correlaciona con el rendimiento downstream. Ahorra tiempo en evaluación.
Los tokens de grafo tienen alta activación pero baja utilidad semántica. Este análisis mecanicista revela la desconexión en modelos de lenguaje de grafos.
Descubre CoralBay, modelo auto-supervisado para TC que aprende representaciones 3D. Mejora el diagnóstico radiológico con un nuevo benchmark.
Descubre cómo la invarianza en el ensamblado de modelos revela discrepancias funcionales ocultas y mejora la evaluación de similitud en deep learning.
Descubre cómo TIDFormer revoluciona el análisis de grafos dinámicos con su mecanismo de atención eficiente e interpretable, superando modelos previos.
QUIVER incorpora vistas cuántico-informadas para mejorar representaciones en grandes modelos de ML, ofreciendo mejoras medibles en QM9 y JetClass.
Descubre EntangleCodec, el tokenizador de audio que unifica semántica y acústica. Mejora la comprensión de audio en un 7.4% y escala desde 0.6B a 8B parámetros, superando modelos mucho más grandes.
Estudio empírico revela que ninguna representación molecular es universalmente mejor para LLMs. Descubre cuál usar según la tarea química.
Aplicamos MAP-Elites para generar mapas FPS con nuevas representaciones. Resultados: mayor diversidad y calidad en niveles. ¡Descúbrelo!
Composición secuencial de grupos: una ventana a la mecánica del deep learning. Descubre cómo redes neuronales aprenden operaciones estructuradas.
Aprende cómo MVL usa suavizado espacial para estimación de valor estable en RL offline, mejorando navegación y manipulación robótica.
Descubre cómo RGVQ evita el colapso del codebook en grafos usando regularización topológica y contrastiva para tokens más expresivos.
Descubre cómo HUVR+SIREN logra mayor fidelidad en terrenos de alta resolución sin almacenamiento extra. Benchmark revela claves.