HiSE: Explicador Semántico Jerárquico Ligero para Grafos Heterogéneos
HiSE es un explicador ligero para redes neuronales de grafos heterogéneos con explicaciones semánticas jerárquicas de alta fidelidad y bajo costo.
HiSE es un explicador ligero para redes neuronales de grafos heterogéneos con explicaciones semánticas jerárquicas de alta fidelidad y bajo costo.
Descubre cómo PipeDream logra convergencia en entrenamiento distribuido con un nuevo análisis teórico no convexo. Comparativa con LocalSGD.
Descubre cómo STAMP alinea transcriptómica espacial con modelos de patología para mejorar el perfil molecular tumoral sin análisis genómicos costosos.
Descubre cómo el speedrun de nanoTabPFN logró un speedup de 81x en preentrenamiento de modelos tabulares. Participa y contribuye al benchmark abierto en GitHub.
Los tokens de grafo tienen alta activación pero baja utilidad semántica. Este análisis mecanicista revela la desconexión en modelos de lenguaje de grafos.
Descubre cómo fusionar múltiples LoRAs en un solo adaptador de bajo rango con Compress-then-Merge, mejorando eficiencia y rendimiento sin perder estructura.
Descubre cómo el muestreo posterior calibrado reduce las alucinaciones en LLMs, mejorando coherencia y utilidad en generación de texto.
Descubre TreeFlash: acelera la decodificación especulativa con aproximación autorregresiva paralela. Logra un 12% más de eficiencia y 9% más de velocidad.
Aprende cómo las convoluciones dinámicas mejoran los Transformers con ventajas en eficiencia. Implementación con kernels Triton.
Reveal-IG: atribución basada en caminos distribucionales. Atribuciones estables con signo sin artefactos. Ideal para explicabilidad en IA.
Descubre VaSE, un método de evicción de caché KV que protege valores grandes y usa estocasticidad para mejorar precisión en modelos de razonamiento. Reduce memoria 4x sin perder rendimiento.
Corrige sesgo espectral en operadores neuronales usando difusión posterior y observaciones dispersas, logrando predicciones precisas con solo un 5% de cobertura.
Skill-RM unifica criterios heterogéneos usando habilidades de agente para optimizar LLMs en entrenamiento posterior. ¡Prueba el nuevo modelo!
Un estudio revela cómo las neuronas en modelos de IA se vuelven más especializadas y menos compartidas a medida que crece el tamaño del modelo. Descubre el efecto de polarización neuronal.
Descubre cómo diagnosticar fases en espacios latentes mejora generación y detección de anomalías. Nuevo paradigma basado en vidrio de espín.
Descubre cómo recuperar la volatilidad acoplada al estado en sistemas latentes con observación parcial usando filtros de partículas.
Filtro de Kalman Adaptativo Híbrido con aprendizaje auto-supervisado para seguimiento y clasificación eficiente con pocos datos. Mejora la precisión y robustez.
Descubre cómo SeismoGPT, un modelo transformer, pronostica sismogramas triaxiales. Aplicaciones en alerta sísmica y mitigación de desastres.
Descubre cómo KeyVT optimiza la selección de vistas y tokens para responder preguntas sobre escenas 3D sin entrenamiento, superando a métodos existentes.
GLINT alinea visión-lenguaje en radiología con compuertas dispersas. Logra segmentación zero-shot en 3D sin supervisión y supera a modelos previos.