Predicción de Errores Composicionales en LLMs con Geometría de Características
Descubre cómo anticipar fallos en LLMs usando la geometría de sus representaciones. Predice errores composicionales por interferencia de características.
Descubre cómo anticipar fallos en LLMs usando la geometría de sus representaciones. Predice errores composicionales por interferencia de características.
Descubre cómo los modelos de visión-lenguaje fingen entender imágenes. Un estudio revela dos tipos de fallos: sesgos textuales e imágenes espurias. Aprende más.
Descubre AOE, una nueva forma de representar números que permite a la IA entender su valor real y modular. Sin entrenamiento, mejora tareas algebraicas y logra precisión perfecta. ¡Plug-and-play!
Descubre CoMAG, un método que alinea contextos y modalidades en grafos atribuidos multimodales para mejorar predicciones y emparejamiento. ¡Resultados líderes!
CoMAG unifica grafos multimodales aprendiendo contextos adaptativos y alineando modalidades sin comprimir información. Logra estado del arte en predicción, matching y generación.
Descubre LESS, un nuevo método de representaciones locales para imagen táctil que permite reconstrucción 3D con palpación humana y aprendizaje auto-supervisado.
Descubre cómo los modelos de lenguaje multilingües representan las lenguas: separabilidad, jerarquías y efectos no deseados entre idiomas. Implicaciones para IA confiable.
El modelo MLPF de flujo de partículas con IA sirve como base para identificar jets, regresión energética y momento faltante, superando a métodos tradicionales con 35 veces menos parámetros.
Descubre cómo descomponer el espacio latente en factores invariantes y de simetría para lograr representaciones equivariantes, interpretables y desenredadas. Aplica a datos con simetrías.
Descubre cómo V-pretraining mejora capacidades objetivo usando pocos ejemplos finales como feedback, sin degradar la generalización. Ideal para modelos de lenguaje y visión.
Descubre cómo patrones de signo en dimensiones de transformers revelan semántica sin entrenamiento. Nuevo enfoque: 'Bag of Dims'.
Descubre cómo los modelos autorregresivos de dos capas estiman estados latentes imitando el filtrado de Kalman. Con resultados teóricos.
Descubre PlaceRep, un método que aprende representaciones de lugares a partir de puntos de interés, superando límites administrativos y mejorando predicciones urbanas.
Descubre cómo HELVAE mejora los autoencoders multimodales usando la divergencia Hellinger para representaciones latentes más expresivas y mejor equilibrio entre coherencia y calidad.
Descubre LatentLens, un método que revela qué codifican los tokens visuales en modelos de lenguaje. Mejora la interpretabilidad de VLMs.
La precisión del probing se satura pronto en LLM; la fragilidad revela la evolución oculta de representaciones. Descubre esta métrica complementaria.
SirenFNO aprende frecuencias completas sin truncamiento, eliminando el sesgo espectral de FNO. Reduce parámetros hasta 73 veces en PDEs con oscilaciones de alta frecuencia. ¡Mejora la eficiencia!
Descubre qué miden las métricas geométricas en LLMs y cómo pueden mejorar la evaluación de modelos de lenguaje. Un estudio revela cuándo funcionan y sus limitaciones.
La tristeza depende más del contexto. Estudio causal revela cómo la saturación de contexto y marcadores discursivos mejoran el reconocimiento emocional.
Descubre Orthogonal Subspace Carving: enlace recursivo profundo con memoria constante. Supera TPR y VSA con eficiencia y fidelidad sin crecimiento exponencial.