#modelo

HiSE: Explicador Semántico Jerárquico Ligero para Grafos Heterogéneos

HiSE es un explicador ligero para redes neuronales de grafos heterogéneos con explicaciones semánticas jerárquicas de alta fidelidad y bajo costo.

2026-06-03 · 1 min

Desmitificando el paralelismo de pipelines: teoría para PipeDream

Descubre cómo PipeDream logra convergencia en entrenamiento distribuido con un nuevo análisis teórico no convexo. Comparativa con LocalSGD.

2026-06-03 · 2 min

Alineación con transcriptómica espacial mejora perfiles moleculares en patología

Descubre cómo STAMP alinea transcriptómica espacial con modelos de patología para mejorar el perfil molecular tumoral sin análisis genómicos costosos.

2026-06-03 · 2 min

Speedrun de preentrenamiento de modelos tabulares

Descubre cómo el speedrun de nanoTabPFN logró un speedup de 81x en preentrenamiento de modelos tabulares. Participa y contribuye al benchmark abierto en GitHub.

2026-06-03 · 3 min

Cuando los tokens de grafo se hunden: análisis mecanicista

Los tokens de grafo tienen alta activación pero baja utilidad semántica. Este análisis mecanicista revela la desconexión en modelos de lenguaje de grafos.

2026-06-03 · 3 min

Compress then Merge: cómo fusionar LoRAs en un único adaptador

Descubre cómo fusionar múltiples LoRAs en un solo adaptador de bajo rango con Compress-then-Merge, mejorando eficiencia y rendimiento sin perder estructura.

2026-06-03 · 3 min

Modelado de lenguaje conforme mediante muestreo posterior

Descubre cómo el muestreo posterior calibrado reduce las alucinaciones en LLMs, mejorando coherencia y utilidad en generación de texto.

2026-06-03 · 2 min

TreeFlash: Aproximación AR Paralela para Decodificación Especulativa más Rápida

Descubre TreeFlash: acelera la decodificación especulativa con aproximación autorregresiva paralela. Logra un 12% más de eficiencia y 9% más de velocidad.

2026-06-03 · 1 min

Convoluciones cortas dinámicas mejoran los Transformers

Aprende cómo las convoluciones dinámicas mejoran los Transformers con ventajas en eficiencia. Implementación con kernels Triton.

2026-06-03 · 2 min

Reveal-IG: Atribución por caminos distribucionales

Reveal-IG: atribución basada en caminos distribucionales. Atribuciones estables con signo sin artefactos. Ideal para explicabilidad en IA.

2026-06-03 · 2 min

VaSE: Evicción de Caché KV Estocástica Consciente del Valor

Descubre VaSE, un método de evicción de caché KV que protege valores grandes y usa estocasticidad para mejorar precisión en modelos de razonamiento. Reduce memoria 4x sin perder rendimiento.

2026-06-03 · 1 min

Corrigiendo el sesgo espectral en operadores neurales con difusión posterior

Corrige sesgo espectral en operadores neuronales usando difusión posterior y observaciones dispersas, logrando predicciones precisas con solo un 5% de cobertura.

2026-06-03 · 3 min

Skill-RM: Unificando Criterios Heterogéneos con Habilidades de Agente

Skill-RM unifica criterios heterogéneos usando habilidades de agente para optimizar LLMs en entrenamiento posterior. ¡Prueba el nuevo modelo!

2026-06-03 · 3 min

Poblaciones neuronales: selectividad divergente con la escala

Un estudio revela cómo las neuronas en modelos de IA se vuelven más especializadas y menos compartidas a medida que crece el tamaño del modelo. Descubre el efecto de polarización neuronal.

2026-06-03 · 2 min

Diagnosticar latentes de alta dimensión con estructura de fase

Descubre cómo diagnosticar fases en espacios latentes mejora generación y detección de anomalías. Nuevo paradigma basado en vidrio de espín.

2026-06-03 · 2 min

Recuperación de la volatilidad acoplada al estado bajo observación parcial

Descubre cómo recuperar la volatilidad acoplada al estado en sistemas latentes con observación parcial usando filtros de partículas.

2026-06-03 · 2 min

Filtro de Kalman Adaptativo Híbrido para Seguimiento y Clasificación Eficiente

Filtro de Kalman Adaptativo Híbrido con aprendizaje auto-supervisado para seguimiento y clasificación eficiente con pocos datos. Mejora la precisión y robustez.

2026-06-03 · 2 min

Pronóstico de sismogramas de tres componentes con transformers

Descubre cómo SeismoGPT, un modelo transformer, pronostica sismogramas triaxiales. Aplicaciones en alerta sísmica y mitigación de desastres.

2026-06-03 · 2 min

Respuesta a preguntas 3D Zero-Shot mediante transporte jerárquico de vista a token

Descubre cómo KeyVT optimiza la selección de vistas y tokens para responder preguntas sobre escenas 3D sin entrenamiento, superando a métodos existentes.

2026-06-03 · 3 min

GLINT: Alineación dispersa de visión-lenguaje para radiología

GLINT alinea visión-lenguaje en radiología con compuertas dispersas. Logra segmentación zero-shot en 3D sin supervisión y supera a modelos previos.

2026-06-03 · 2 min