Test-time training: adaptación óptima desde la teoría de decisión
Descubre cuándo y cómo adaptar modelos en test-time training usando teoría de decisión, mejorando precisión y estabilidad. Evita sobreajuste con estrategias
Descubre cuándo y cómo adaptar modelos en test-time training usando teoría de decisión, mejorando precisión y estabilidad. Evita sobreajuste con estrategias
Mejora el pronóstico bursátil con aumento de datos desplazados y Transformers. Resultados en VN30 y S&P 500.
Predice parámetros de ejecución en química computacional con aprendizaje activo y generativo. Modelos alcanzan 99.9% de precisión.
Descubre LiFT, un método basado en programación lineal que ajusta transformers controlando el sobreajuste, mejorando la perplejidad en GPT-2 con WikiText-2.
Descubre GENIE, un optimizador que usa el ratio OSGR para equilibrar actualizaciones de parámetros y mejorar la generalización a dominios no vistos. Supera a
HiRo logra 99.46% en MNIST, 85.57% en CIFAR-10 y 59.10% en CIFAR-100 con menos de 1M de parámetros. Descubre este modelo eficiente de clasificación de imágenes.
Descubre cómo una nueva ley de conservación en métodos de aprendizaje físico estabiliza el entrenamiento de redes, garantizando convergencia en circuitos
Aprendizaje automático para diseño inverso de fresado: reduce rugosidad superficial con redes neuronales y optimización bayesiana.
Descubre cómo un modelo GPT acelera la simulación de impactos en el detector CLAS12, superando a Geant4 con 700 eventos por segundo y manteniendo precisión
Descubre cómo las redes neuronales ReLU pueden ser caracterizadas mediante ecuaciones polinómicas y variedades algebraicas, revelando su expresividad y
Descubre cómo el marco Koopman-PINN mejora la inferencia y el pronóstico a largo plazo en modelos epidémicos, usando datos sintéticos y reales de COVID-19.
Estudio geométrico revela cómo la separación mínima entre componentes afecta la convergencia en la estimación de parámetros de mezclas Gaussianas. ¡Más!
DP-Hype: algoritmo federado para búsqueda de hiperparámetros con privacidad diferencial. Escalable, independiente de tareas y garantías de privacidad.
Descubre cómo la cantidad de cómputo impacta el aprendizaje por refuerzo. Un nuevo estudio demuestra que más cómputo supera a redes con más parámetros en
Aprende cómo GRASP logra un 93.5% de precisión media usando solo memoria constante, fusionando modelos secuencialmente.
Descubre cómo los agentes ReAct con estado reducen hasta un 90% el consumo de tokens en experimentación autónoma, optimizando hiperparámetros y código.
Descubre AdaNAGED: optimización sin parámetros y sin gradientes para ajuste fino de LLMs con ahorro de memoria.
Descubre cómo los puntos antimareo de Apple usan el acelerómetro de tu iPhone para eliminar el mareo al trabajar en el coche. ¡Adiós a las náuseas!
Descubre PreLort: optimiza el ajuste fino federado de LLMs con LoRA, superando heterogeneidad de rangos y mejorando precisión y ROUGE-L.
Descubre cómo Expert Tying reduce casi a la mitad la memoria de LLMs MoE sin afectar la calidad. Una innovación para escalar modelos eficientemente.