Precarga espacio-temporal de expertos para inferencia eficiente en MoE LLM
Descubre cómo la precarga espacio-temporal de expertos acelera la inferencia de LLMs MoE sin sacrificar precisión. Mejora rendimiento y eficiencia energética.
Descubre cómo la precarga espacio-temporal de expertos acelera la inferencia de LLMs MoE sin sacrificar precisión. Mejora rendimiento y eficiencia energética.
Descubre SN-VI, un nuevo marco de inferencia variacional que modela dependencias latentes sin suposiciones de campo medio. Mejora la precisión en modelos
Descubre cómo los autoencoders dispersos revelan patrones visuales en aeronaves, mejorando la interpretabilidad de modelos de IA.
¿Cómo lograr imitación robótica robusta incluso cuando fallan sensores? RL4IL usa aprendizaje por refuerzo y fusión suave. Supera métodos previos.
Descubre EIBench, un benchmark interactivo para gestión emocional. CTC-GRPO mejora la inteligencia emocional de los LLMs en múltiples turnos.
Descubre Schattor, una familia de métodos adaptativos basados en normas Schatten que unifica SGD y Muon para optimizar modelos de deep learning.
Descubre cómo el acondicionamiento acústico por etapas mejora el aprendizaje con pocos ejemplos en modelos de audio. Incrementa el rendimiento en clasificación.
Descubre cómo FACR garantiza explicaciones emocionales fieles al usar un gráfico causal de unidades de acción, mejorando la precisión en IA.
VarDeepPCA es un plugin DNN variacional sin muestreo que restaura segmentaciones médicas OOD, ofreciendo incertidumbre con pequeños conjuntos de datos.
Descubre cómo las partículas mean-shift amortizadas mejoran la integración bayesiana sin evaluar la densidad posterior, superando a Monte Carlo en precisión y
Descubre cómo el análisis de biarquetipos identifica regímenes en bonos europeos (2001-2025) con Alemania, Grecia y Hungría como arquetipos.
Nueva técnica de locomoción cuadrúpeda reduce un 56% el costo de transporte sin patrones de marcha. Ideal para robots adaptables al terreno.
Descubre cómo PromptShift-CRC controla el riesgo en modelos fundacionales ante cambios en prompts y dominios. Aprendizaje adaptativo en tiempo real.
Descubre cómo las redes neuronales predicen observables del estado base usando datos de experimentos cuánticos con hasta 115 qubits en el modelo Heisenberg XXZ.
Descubre por qué la regresión lineal múltiple pierde interpretabilidad con multicolinealidad. Analizamos sus límites y cómo la regularización Ridge ayuda.
Aprendizaje automático para diseño inverso de fresado: reduce rugosidad superficial con redes neuronales y optimización bayesiana.
Descubre cómo un modelo GPT acelera la simulación de impactos en el detector CLAS12, superando a Geant4 con 700 eventos por segundo y manteniendo precisión
Presentamos un nuevo método polinomial para la generación de lenguajes con límite de errores, aplicado a funciones booleanas monótonas. Basado en un juego
Los anyones mejoran el aprendizaje cuántico. Descubre cómo sus estadísticas de intercambio fraccionario superan a bosones y fermiones en benchmarks.
Descubre cómo Helmholtz-SDE cierra la brecha de aproximación en SDEs latentes sin simulación, logrando inferencia precisa y rápida. Ideal para sistemas