#ate · DeepCodeNews

Red Neuronal de Grafos con Atención Espacio-Temporal: Explicando Causalidades

STA-GNN: detección explicable de anomalías en ICS usando atención espacio-temporal. Control de falsos positivos y adaptación a derivas.

2026-06-10 · 2 min

Muestreo Guiado por Latente para Optimización Combinatoria

LGS-Net revoluciona la optimización combinatoria con muestreo guiado por latente y MCMC. Resultados state-of-the-art en problemas de enrutamiento.

2026-06-10 · 2 min

MMD Guidance: Adaptación de distribución sin reentrenamiento

Descubre MMD Guidance, método sin entrenamiento que alinea modelos de difusión con datos de referencia y discrepancia máxima media. Ideal para pocos ejemplos.

2026-06-10 · 2 min

Descomposición ANOVA funcional exacta para variables categóricas

Descubre la descomposición ANOVA funcional exacta sin suposiciones para variables categóricas: cálculo eficiente y generalización de SHAP.

2026-06-10 · 2 min

Adopción de IA Generativa en la Ingeniería de Software Alemana

Descubre los resultados de un estudio empírico sobre la adopción de IA generativa en la ingeniería de software alemana: factores clave, desafíos regulatorios y recomendaciones para empresas.

2026-06-10 · 2 min

Análisis de campo medio de auto-atención multicabezal bajo entropía cruzada

Explora un nuevo marco teórico de campo medio para la auto-atención multicabezal, estableciendo condiciones de convergencia y estabilidad bajo entrenamiento con entropía cruzada.

2026-06-10 · 2 min

Optimización en dos etapas para eludir copyright en difusión

El método TS-LFO elude defensas de copyright en modelos de difusión con optimización latente en dos etapas, superando a DiffPure, GrIDPure e IMPRESS.

2026-06-10 · 3 min

IntentKV: poda inteligente de caché KV para agentes de IA

Descubre IntentKV, una técnica que poda la caché KV sin perder precisión, reduciendo un 92% el consumo de memoria en agentes LLM. Ideal para sistemas multi-turno.

2026-06-10 · 3 min

Fusión de operadores para inferencia de LLM en arquitectura Tensix

Descubre cómo la fusión de operadores en la arquitectura Tensix reduce hasta un 37% la latencia en atención de LLM, manteniendo precisión superior al 98% en inferencia local.

2026-06-10 · 2 min

Aprendizaje de hiperparámetros para factorización latente de tensores en redes dinámicas

Descubre cómo DE-LFT automatiza la búsqueda de hiperparámetros en factorización de tensores para mejorar la precisión en redes dinámicas. Menos esfuerzo, mejores resultados.

2026-06-10 · 2 min

Un lente, muchos mundos: interfaz tipada para IA interpretable

¿Cansado de reimplementar interpretabilidad? WorldModelLens unifica el análisis con una interfaz tipada. Descúbrelo.

2026-06-10 · 3 min

SinkRec: Mitigación del hundimiento semántico en secuencias largas

Descubre SinkRec: modelo que mitiga el hundimiento semántico en recomendaciones de secuencias largas con memoria condicionada y redes delta. Eficiente.

2026-06-10 · 2 min

Diagramas de Hasse para Atención en Transformers

Descubre cómo los Diagramas de Hasse permiten diseñar máscaras de atención eficientes en Transformers, mejorando el flujo de información y la consistencia entrenamiento-inferencia.

2026-06-10 · 2 min

Optimalidad de tokens FSQ en difusión continua para datos categóricos (TTS)

Los tokens FSQ son óptimos para difusión continua en datos categóricos. Este estudio demuestra que superan a modelos LLM en TTS siendo más pequeños y rápidos.

2026-06-10 · 2 min

Dentro del Flujo Latente: Dinámica de Atención en Separación de Audio

Descifra la dinámica de atención en modelos de audio con LSAC: acelera sin entrenamiento, manteniendo calidad.

2026-06-10 · 2 min

Dropout-GRPO: Variabilidad estocástica para razonamiento latente continuo

Dropout-GRPO introduce variabilidad estocástica en razonamiento latente para mejorar el aprendizaje por refuerzo grupal. Resultados en GSM8K.

2026-06-10 · 2 min

El Mentiroso Confiado: Diagnóstico con Log-Probabilidades y LLM en Debate Multi-Agente

¿Los modelos de IA mienten? Este estudio usa log-probabilidades y juez LLM para evaluar razonamiento en debates multi-agente y detectar fallos críticos.

2026-06-10 · 2 min

Aprovechando la inteligencia colectiva de agentes de IA para nuevos descubrimientos

Descubre cómo EinsteinArena permite a agentes de IA colaborar abiertamente para superar récords humanos en matemáticas. ¡12 nuevos avances!

2026-06-10 · 2 min

ERAlign: Alineación de Representaciones de GNNs y LLMs en Grafos Textuales

Descubre ERAlign: alinea GNNs y LLMs en grafos textuales con modelos energéticos, mejorando el rendimiento sin costos altos de muestreo.

2026-06-10 · 1 min

Moderación en streaming de LLMs con sondas de estado oculto

Las sondas de estado oculto permiten moderar LLMs en streaming sin costo adicional. Detén contenido inseguro token a token, reduce latencia y ahorra recursos. Guía práctica.

2026-06-10 · 3 min