AdaGC: Mejora la estabilidad del preentrenamiento con recorte adaptativo
AdaGC mejora la estabilidad del preentrenamiento de modelos de lenguaje grandes (LLM) eliminando picos de pérdida y aumentando la precisión en hasta 2.48%.
AdaGC mejora la estabilidad del preentrenamiento de modelos de lenguaje grandes (LLM) eliminando picos de pérdida y aumentando la precisión en hasta 2.48%.
Descubre FreshRetailNet-LT, el primer dataset con datos de demanda censurada y desabastecimientos para mejorar la previsión en retail fresco.
La teoría del aprendizaje automático ayuda a litigantes a seleccionar casos clave para influir en precedentes legales. Descubre cómo.
Descubre RoboGPT-R1 combina supervisión y aprendizaje por refuerzo para mejorar la planificación robótica, superando modelos más grandes en tareas complejas
Descubre O2CP, un marco de predicción conforme online que optimiza intervalos multi-paso, logrando cobertura garantizada y menor desperdicio. Ideal para series temporales en IA y cloud.
Nuevo análisis del gradiente natural submuestreado: convergencia global con un mini-batch y ventaja sobre SGD.
Descubre cómo los priores estructurales no paramétricos y los grafos de precedencia permiten a los LLMs predecir teoremas geométricos con un 89.29% de precisión, superando modelos supervisados.
Descubre cómo las Mezclas de Operadores Neuronales reducen la complejidad activa en el aprendizaje de operadores, mejorando la eficiencia computacional.
Mejora la precisión y fiabilidad del pronóstico de incendios forestales con deep learning que cuantifica la incertidumbre. Reduce errores de calibración un 2.1%.
Usa señales privilegiadas sin estado completo para mejorar RL parcial. Descubre cómo seleccionar las más informativas. ¡Optimiza tu IA!
Descubre el Conditional Vendi Score, una nueva métrica que aísla la diversidad generada por el modelo en sistemas de IA guiados por prompts. Ideal para evaluar LLMs y modelos texto-imagen.
La influencia de los datos en redes neuronales cambia con picos y cambios de signo durante el entrenamiento. Un nuevo marco basado en teoría singular.
Descubre cómo el marco E-SUOT mejora la adaptación gradual de dominio usando transporte óptimo semidual, superando limitaciones de estimación de verosimilitud.
Descubre cómo S3-GFN genera moléculas sintetizables con GFlowNets y priores químicos, logrando altas recompensas y más del 95% de sintetizabilidad.
Descubre cómo CITRAS, un Transformer con covariables, mejora el pronóstico de series temporales integrando datos pasados y futuros. Aumenta la precisión con atención cruzada.
DAH-Net logra 99.19% de precisión en reconocimiento de emociones con EEG. Red híbrida interpretable y robusta.
Descubre cómo los Modelos de Difusión Ciega (BDDMs) eliminan ruido condicionado y aprovechan baja dimensionalidad. Teoría completa, resultados adaptativos.
Descubre PRISM: modelo que combina iteraciones residuales con paralelismo total para lograr 174x de rendimiento sin perder expresividad.
AnomaMind detecta anomalías temporales con razonamiento aumentado por herramientas. Mejora precisión y generalización en múltiples dominios.
LWM-Planner: planificación anticipada con hechos para agentes LLM. Extrae hechos de experiencias, simula el mundo y mejora decisiones sin ajustes de parámetros.