De lo simbólico a lo geométrico: razonamiento espacial en LLMs
Descubre cómo el nuevo SLM integra representaciones geométricas para lograr razonamiento espacial real en LLMs, superando métodos simbólicos tradicionales.
Descubre cómo el nuevo SLM integra representaciones geométricas para lograr razonamiento espacial real en LLMs, superando métodos simbólicos tradicionales.
M³Eval: primer benchmark que evalúa la memoria en modelos multimodales con tareas de video cognitivas. Descubre sus debilidades.
Descubre GeM-NR, un método innovador para editar imágenes multivista con cambios drásticos de geometría y apariencia, sin necesidad de entrenamiento previo. Mejora la consistencia en escenas 3D.
Descubre cómo las instrucciones transforman las representaciones internas de la IA. Un estudio revela la geometría detrás del comportamiento inducido.
Los Tokens de Percepción Imaginativa (IPT) mejoran el razonamiento espacial en modelos multimodales sin generar imágenes. Aumento del 3.4% en precisión en conteo multivista.
Estudio revela que representaciones de pila en transformers son causalmente necesarias para lenguajes contadores. Evidencia empírica crucial.
Descubre cómo las representaciones Laplacianas mejoran la planificación en tiempo de decisión en RL, descomponiendo problemas complejos en subobjetivos. El algo
Descubre cómo las representaciones generalizadas de Fourier permiten aprender DNF bajo distribuciones no producto. Un avance clave en teoría del aprendizaje automático.
Descubre por qué descomposiciones tensoriales tienen limitaciones en la compresión de LLMs y cómo afectan a modelos densos y MoE. Análisis teórico y práctico.
¿Aprenden los LLM a representar el modelo del mundo al planificar? Este análisis revela cómo el ajuste supervisado codifica la validez de acciones y predicados.
Formalizamos el problema de vinculación en visión artificial. Mide la información de vinculación en Vision Transformers para mejorar el reconocimiento.
Nueva técnica: coherencia geométrica para interpretar redes neuronales. Aplicaciones en BERT y autoencoders.
Descubre cómo las redes neuronales aprenden representaciones espectrales de grupos, convergencia demostrable a irreducibles y compresión de bajo rango.
Hidden-Align alinea estados ocultos en modelos de lenguaje, mejorando el razonamiento matemático hasta un 6.2% en benchmarks. Técnica innovadora de RL.
Descubre cómo IdEst, basado en dimensión intrínseca, evalúa representaciones SSL de forma eficiente, reduciendo costos computacionales y sin necesidad de etiquetas.
IdEst evalúa representaciones SSL con dimensión intrínseca: métrica geométrica que correlaciona con el rendimiento downstream. Ahorra tiempo en evaluación.
Los tokens de grafo tienen alta activación pero baja utilidad semántica. Este análisis mecanicista revela la desconexión en modelos de lenguaje de grafos.
Descubre CoralBay, modelo auto-supervisado para TC que aprende representaciones 3D. Mejora el diagnóstico radiológico con un nuevo benchmark.
Descubre cómo la invarianza en el ensamblado de modelos revela discrepancias funcionales ocultas y mejora la evaluación de similitud en deep learning.
Descubre cómo TIDFormer revoluciona el análisis de grafos dinámicos con su mecanismo de atención eficiente e interpretable, superando modelos previos.