#presentaciones

Repensando descomposiciones tensoriales en compresión post-entrenamiento de LLMs

Descubre por qué descomposiciones tensoriales tienen limitaciones en la compresión de LLMs y cómo afectan a modelos densos y MoE. Análisis teórico y práctico.

2026-06-03 · 2 min

Recuperación del modelo del mundo en planificadores LLM ajustados

¿Aprenden los LLM a representar el modelo del mundo al planificar? Este análisis revela cómo el ajuste supervisado codifica la validez de acciones y predicados.

2026-06-03 · 2 min

Formalizando el problema de vinculación en visión artificial

Formalizamos el problema de vinculación en visión artificial. Mide la información de vinculación en Vision Transformers para mejorar el reconocimiento.

2026-06-03 · 2 min

Representaciones Coherentes: Enfoque Topológico para Interpretabilidad

Nueva técnica: coherencia geométrica para interpretar redes neuronales. Aplicaciones en BERT y autoencoders.

2026-06-03 · 2 min

Redes neuronales: aprendizaje demostrable de representaciones espectrales de grupos

Descubre cómo las redes neuronales aprenden representaciones espectrales de grupos, convergencia demostrable a irreducibles y compresión de bajo rango.

2026-06-03 · 2 min

El acierto hace la fuerza: alinear estados ocultos para RL

Hidden-Align alinea estados ocultos en modelos de lenguaje, mejorando el razonamiento matemático hasta un 6.2% en benchmarks. Técnica innovadora de RL.

2026-06-03 · 2 min

IdEst: Evaluando Representaciones SSL con Dimensión Intrínseca

Descubre cómo IdEst, basado en dimensión intrínseca, evalúa representaciones SSL de forma eficiente, reduciendo costos computacionales y sin necesidad de etiquetas.

2026-06-03 · 3 min

IdEst: dimensión intrínseca para evaluar representaciones SSL

IdEst evalúa representaciones SSL con dimensión intrínseca: métrica geométrica que correlaciona con el rendimiento downstream. Ahorra tiempo en evaluación.

2026-06-03 · 1 min

Cuando los tokens de grafo se hunden: análisis mecanicista

Los tokens de grafo tienen alta activación pero baja utilidad semántica. Este análisis mecanicista revela la desconexión en modelos de lenguaje de grafos.

2026-06-03 · 3 min

CoralBay: modelo base de TC con auto-supervisión

Descubre CoralBay, modelo auto-supervisado para TC que aprende representaciones 3D. Mejora el diagnóstico radiológico con un nuevo benchmark.

2026-06-03 · 1 min

Similitud funcional con ensamblado consciente de invarianza

Descubre cómo la invarianza en el ensamblado de modelos revela discrepancias funcionales ocultas y mejora la evaluación de similitud en deep learning.

2026-06-03 · 2 min

TIDFormer: explotando dinámica temporal e interactiva en grafos dinámicos

Descubre cómo TIDFormer revoluciona el análisis de grafos dinámicos con su mecanismo de atención eficiente e interpretable, superando modelos previos.

2026-06-03 · 2 min

QUIVER: Vistas Cuánticas para Representaciones en Grandes Modelos ML

QUIVER incorpora vistas cuántico-informadas para mejorar representaciones en grandes modelos de ML, ofreciendo mejoras medibles en QM9 y JetClass.

2026-06-03 · 2 min

EntangleCodec: Tokenizador de Audio Unificado con Entrelazamiento Semántico-Acústico

Descubre EntangleCodec, el tokenizador de audio que unifica semántica y acústica. Mejora la comprensión de audio en un 7.4% y escala desde 0.6B a 8B parámetros, superando modelos mucho más grandes.

2026-06-03 · 3 min