#representaciones

De lo simbólico a lo geométrico: razonamiento espacial en LLMs

Descubre cómo el nuevo SLM integra representaciones geométricas para lograr razonamiento espacial real en LLMs, superando métodos simbólicos tradicionales.

2026-06-04 · 2 min

M³Eval: Evaluación de Memoria Multimodal con Tareas de Video Cognitivas

M³Eval: primer benchmark que evalúa la memoria en modelos multimodales con tareas de video cognitivas. Descubre sus debilidades.

2026-06-04 · 1 min

GeM-NR: Edición multivista con conciencia geométrica para cambios no rígidos

Descubre GeM-NR, un método innovador para editar imágenes multivista con cambios drásticos de geometría y apariencia, sin necesidad de entrenamiento previo. Mejora la consistencia en escenas 3D.

2026-06-04 · 2 min

Descomponiendo cómo el prompting guía el comportamiento

Descubre cómo las instrucciones transforman las representaciones internas de la IA. Un estudio revela la geometría detrás del comportamiento inducido.

2026-06-03 · 3 min

Tokens de Percepción Imaginativa Mejoran Razonamiento Espacial

Los Tokens de Percepción Imaginativa (IPT) mejoran el razonamiento espacial en modelos multimodales sin generar imágenes. Aumento del 3.4% en precisión en conteo multivista.

2026-06-03 · 1 min

Evidencia causal de representaciones de pila en modelos de contadores con transformers

Estudio revela que representaciones de pila en transformers son causalmente necesarias para lenguajes contadores. Evidencia empírica crucial.

2026-06-03 · 1 min

Representaciones Laplacianas para Planificación en Tiempo de Decisión

Descubre cómo las representaciones Laplacianas mejoran la planificación en tiempo de decisión en RL, descomponiendo problemas complejos en subobjetivos. El algo

2026-06-03 · 2 min

Aprendizaje de DNF mediante representaciones generalizadas de Fourier

Descubre cómo las representaciones generalizadas de Fourier permiten aprender DNF bajo distribuciones no producto. Un avance clave en teoría del aprendizaje automático.

2026-06-03 · 2 min

Repensando descomposiciones tensoriales en compresión post-entrenamiento de LLMs

Descubre por qué descomposiciones tensoriales tienen limitaciones en la compresión de LLMs y cómo afectan a modelos densos y MoE. Análisis teórico y práctico.

2026-06-03 · 2 min

Recuperación del modelo del mundo en planificadores LLM ajustados

¿Aprenden los LLM a representar el modelo del mundo al planificar? Este análisis revela cómo el ajuste supervisado codifica la validez de acciones y predicados.

2026-06-03 · 2 min

Formalizando el problema de vinculación en visión artificial

Formalizamos el problema de vinculación en visión artificial. Mide la información de vinculación en Vision Transformers para mejorar el reconocimiento.

2026-06-03 · 2 min

Representaciones Coherentes: Enfoque Topológico para Interpretabilidad

Nueva técnica: coherencia geométrica para interpretar redes neuronales. Aplicaciones en BERT y autoencoders.

2026-06-03 · 2 min

Redes neuronales: aprendizaje demostrable de representaciones espectrales de grupos

Descubre cómo las redes neuronales aprenden representaciones espectrales de grupos, convergencia demostrable a irreducibles y compresión de bajo rango.

2026-06-03 · 2 min

El acierto hace la fuerza: alinear estados ocultos para RL

Hidden-Align alinea estados ocultos en modelos de lenguaje, mejorando el razonamiento matemático hasta un 6.2% en benchmarks. Técnica innovadora de RL.

2026-06-03 · 2 min

IdEst: Evaluando Representaciones SSL con Dimensión Intrínseca

Descubre cómo IdEst, basado en dimensión intrínseca, evalúa representaciones SSL de forma eficiente, reduciendo costos computacionales y sin necesidad de etiquetas.

2026-06-03 · 3 min

IdEst: dimensión intrínseca para evaluar representaciones SSL

IdEst evalúa representaciones SSL con dimensión intrínseca: métrica geométrica que correlaciona con el rendimiento downstream. Ahorra tiempo en evaluación.

2026-06-03 · 1 min

Cuando los tokens de grafo se hunden: análisis mecanicista

Los tokens de grafo tienen alta activación pero baja utilidad semántica. Este análisis mecanicista revela la desconexión en modelos de lenguaje de grafos.

2026-06-03 · 3 min

CoralBay: modelo base de TC con auto-supervisión

Descubre CoralBay, modelo auto-supervisado para TC que aprende representaciones 3D. Mejora el diagnóstico radiológico con un nuevo benchmark.

2026-06-03 · 1 min

Similitud funcional con ensamblado consciente de invarianza

Descubre cómo la invarianza en el ensamblado de modelos revela discrepancias funcionales ocultas y mejora la evaluación de similitud en deep learning.

2026-06-03 · 2 min

TIDFormer: explotando dinámica temporal e interactiva en grafos dinámicos

Descubre cómo TIDFormer revoluciona el análisis de grafos dinámicos con su mecanismo de atención eficiente e interpretable, superando modelos previos.

2026-06-03 · 2 min