#moe · DeepCodeNews

DAG-MoE: De la Mezcla Simple a la Agregación Estructural en MoE

Descubre DAG-MoE: agrega estructuralmente expertos para mejorar MoE sin costos adicionales.

2026-06-02 · 1 min

BitsMoE: Asignación eficiente de bits para cuantización de MoE LLM

BitsMoE asigna bits inteligentemente en MoE LLM, logrando cuantización 2 bits con 27.83% más precisión, 12.3x más rápida y 1.76x más velocidad.

2026-06-02 · 2 min

ProbMoE: Enrutamiento Probabilístico Diferenciable para Mixture-of-Experts

ProbMoE: enrutamiento probabilístico para MoE con gradientes exactos y cardinalidad dinámica. Mejora eficiencia y diversidad.

2026-06-02 · 2 min

DOT-MoE: transporte óptimo diferenciable para modelos MoE

Descubre DOT-MoE, un método que convierte modelos de lenguaje densos en MoE usando transporte óptimo diferenciable, manteniendo un 90% del rendimiento con un 50% menos parámetros activos.

2026-06-02 · 2 min

Expertos hiperbólicos y priorizados por evidencia en LVLMs

Descubre AsyMoE: nueva arquitectura para LVLMs que reduce alucinaciones y mejora eficiencia con expertos hiperbólicos y priorización de evidencia.

2026-06-02 · 2 min

MESA: Alineación de seguridad descentralizada para MoE

MESA mejora la alineación de seguridad en modelos MoE mediante la descentralización de expertos. Logra robustez sin sacrificar rendimiento.

2026-06-02 · 1 min

Mellum2 se vuelve open source: modelo rápido para flujos de IA

Descubre Mellum2: modelo open source con arquitectura MoE. Ideal para routing, RAG y sub-agentes en flujos de IA. Baja latencia y costos reducidos.

2026-06-02 · 3 min

Fusión de Expertos en MoE Dispersos con Nash Bargaining

Descubre cómo NAMEx, basado en teoría de juegos, mejora la colaboración entre expertos en modelos MoE, logrando mayor precisión y robustez en IA.

2026-06-01 · 2 min

Mezcla de Expertos en GNN Condicionada por Grafos para Pronóstico de Tráfico

GC-MoE asigna expertos congelados personalizados a cada nodo vial, mejorando precisión en pronóstico de tráfico con solo 17K parámetros.

2026-06-01 · 3 min

PithTrain: Sistema de entrenamiento MoE compacto y nativo para agentes

PithTrain: sistema MoE compacto y nativo para agentes. Iguala rendimiento de frameworks tradicionales y reduce hasta 62% interacciones de agente y 64% tiempo GPU activo.

2026-06-01 · 2 min

Autovectores de expertos: enrutamiento sin colapso y sin entrenamiento

Descubre cómo SSMoE aprovecha los autovectores de los expertos para un enrutamiento sin colapso, mejorando modelos SMoE sin entrenamiento adicional.

2026-06-01 · 2 min

ConMoE: Consolidación del grupo de expertos mediante reasignación de prototipos para la compresión de MoE

ConMoE: consolidación de grupos de expertos con reasignación de prototipos para compresión de MoE. Descubre cómo comprimir modelos MoE optimizando eficiencia y rendimiento.

2026-05-30 · 1 min