#mezcla

Dendrogramas para mezcla de expertos gaussiana con softmax: consistencia sin barridos

Los dendrogramas ofrecen una selección consistente del número de expertos en SGMoE, sin barridos de modelo, superando a AIC/BIC en datos contaminados.

2026-06-09 · 2 min

Identificabilidad y estimación en mezclas no etiquetadas bajo independencia marginal

Descubre cómo identificar componentes latentes en mezclas no etiquetadas usando independencia marginal. Nuevo estimador PM-MMD mejora recuperación sin necesidad de etiquetas.

2026-06-09 · 2 min

Optimización de Políticas Proximales Variacionales

Descubre VP2O, el nuevo marco de optimización variacional que logra +179 ELO en Codeforces y reduce un 32% los tokens en tareas matemáticas.

2026-06-09 · 1 min

Explicando las leyes de escalado en mezcla de datos

Descubre cómo las leyes de escalado explican la mezcla de datos en IA. Aprende sobre competencia de capacidad y reducción de ruido para optimizar modelos.

2026-06-09 · 2 min

Desajuste de repetición: por qué los experimentos de datos no escalan

Descubre por qué los experimentos de mezcla de datos fallan al escalar y cómo el control de repetición ahorra hasta un 94% del presupuesto de tokens.

2026-06-09 · 3 min

Representación de Mezcla Gaussiana Geométrica para Curvas Planas

Descubre cómo representar curvas planas con incertidumbre mediante mezclas gaussianas, una técnica para CAD, robótica y planificación de trayectorias.

2026-06-08 · 2 min

Entrenando un MoE disperso de 120B con escalado reversible

Aprende a entrenar un MoE de 120B parámetros en un solo nodo GPU usando escalado reversible y cuantización. Optimiza memoria y alcanza pérdida de 1.78.

2026-06-08 · 2 min

Expertos lineales diminutos con puertas dispersas

Descubre cómo los expertos lineales diminutos con puertas dispersas (sgatlin) mejoran la eficiencia e interpretabilidad de los modelos de lenguaje, sin aumentar costo.

2026-06-08 · 2 min

CoMetaPNS: Meta-aprendizaje continuo para simulaciones cardíacas personalizadas

Descubre CoMetaPNS, el nuevo marco de meta-aprendizaje continuo que evita el olvido catastrófico en simulaciones cardíacas personalizadas.

2026-06-08 · 2 min

ML informado por reactividad para escoria activada

Aprendizaje automático informado por reactividad predice rendimiento de escoria activada para optimizar diseño y reducir CO2.

2026-06-08 · 2 min

Expertos lineales diminutos con activación dispersa

Descubre cómo sgatlin, expertos lineales diminutos con activación dispersa, mejora la eficiencia y la interpretabilidad de los modelos transformer. Una nueva vía hacia IA más comprensible.

2026-06-08 · 3 min

Desmezclado de imágenes ATR-μFTIR en cortes de pinturas al óleo históricas

Descubre cómo un autoencoder CNN separa mezclas espectrales en imágenes ATR-μFTIR de pinturas históricas, mejorando la interpretación sin supervisión.

2026-06-08 · 2 min

Aprendizaje automático con reactividad predice rendimiento de escorias activadas

Descubre cómo el aprendizaje automático informado por reactividad predice la resistencia de escorias activadas y optimiza el diseño sostenible.

2026-06-08 · 2 min

Dinámicas de aprendizaje bajo reparametrización relativa de modelos singulares

Descubre cómo la reparametrización relativa optimiza la convergencia en modelos singulares como GMM y redes neuronales. Teoría y experimentos.

2026-06-08 · 2 min

Límites composicionales para la fusión de densidades

Fusión de densidades invariante al orden: límites composicionales y reglas de pooling lineal. Clave para sistemas distribuidos de incertidumbre.

2026-06-06 · 2 min

Inestabilidad en la moderación de contenido con mezcla de idiomas

La mezcla de idiomas (Tamil-inglés) desestabiliza la moderación de IA: duplica falsos positivos y carga de revisión. Revela fallos ocultos en clasificación.

2026-06-05 · 2 min

Detección en Línea de Anomalías con Mezclador Causal de Clústeres

Nuevo modelo de IA detecta anomalías en tiempo real en series temporales multivariadas usando clústeres y causalidad, superando a métodos tradicionales.

2026-06-05 · 2 min

Enrutamiento Sinkhorn Selectivo para Mezclas Dispersas de Expertos

Mejora el rendimiento de mezclas dispersas de expertos con enrutamiento Sinkhorn selectivo. Sin pérdidas auxiliares, mayor eficiencia y robustez.

2026-06-05 · 2 min

Selective Sinkhorn Routing para mejorar mezcla dispersa de expertos

Descubre cómo Selective Sinkhorn Routing optimiza modelos SMoE eliminando pérdidas auxiliares, mejorando eficiencia y precisión en lenguaje e imágenes.

2026-06-05 · 2 min

ENBP: Propagación de Creencias Neural Equivariante

ENBP aplica simetría SE(3) a la inferencia probabilística, logrando precisión submilimétrica en moléculas y robótica, 100x más rápido que difusión.

2026-06-05 · 3 min