AutoML para Deep Learning Sostenible: HPO Multiobjetivo en Redes Shift
Aprende a usar AutoML y HPO multiobjetivo en redes shift para obtener modelos con >80% de precisión y mínimo consumo energético. ¡Deep Learning sostenible!
Aprende a usar AutoML y HPO multiobjetivo en redes shift para obtener modelos con >80% de precisión y mínimo consumo energético. ¡Deep Learning sostenible!
Mejora la evaluación de riesgos con modelos de supervivencia que manejan retrasos censurados. Descubre nuestro método con aprendizaje por transferencia.
Operator Boosting permite crear modelos sustitutos de PDE más precisos y con hasta 95% menos parámetros. Descubre cómo optimizar tus simulaciones científicas.
Descubre MGUP: acelera el entrenamiento de modelos de IA con actualizaciones selectivas y garantías de convergencia. Mejora AdamW, Lion y Muon.
Descubre cómo un modelo semi-Markov oculto y análisis de supervivencia revelan la evolución del uso del metro y ayudan a retener pasajeros.
El Método PEM cuantifica la incertidumbre epistémica en simulaciones de Monte Carlo con IA, mejorando la fiabilidad de los resultados.
Meta-clasificación de modelos OCC con ranking y vecino cercano: alta precisión clasificando datos y algoritmos. Solución unificada de modelos, datos y rankings.
Peaje de congestión en NYC impulsó el uso del transporte público, pero con cambios desiguales en la demanda de viajes. Análisis con modelos de pronóstico.
Descubre cómo las codificaciones posicionales sinusoidales y RoPE afectan la equivalencia funcional en Transformers y su conectividad lineal. Un estudio clave
Descubre cómo el olvido catastrófico se concentra en modos de baja dimensión. Teoría del espacio de funciones permite predicción exacta y regularizador
Un pequeño modelo de 3B parámetros desafía a los gigantes de la IA en benchmarks de matemáticas y código. ¿Es el fin de la escalada paramétrica? Análisis
Descubre cómo un pipeline con LLM traduce código Fortran a JAX, acelerando 24x modelos de superficie terrestre con optimización por gradientes.
Investigación que utiliza modelos de lenguaje y visión para predecir intención de cruce peatonal desde vídeos egocéntricos, con un 14.5% más de precisión.
Los proxies profesionales permiten a fabs inteligentes cumplir con SSbD mediante espacios de datos, garantizando privacidad y trazabilidad.
VibeThinker-3B demuestra que modelos pequeños pueden alcanzar rendimiento de vanguardia en razonamiento verificable, superando a sistemas mucho mayores.
Descubre cuándo y cómo adaptar modelos en test-time training usando teoría de decisión, mejorando precisión y estabilidad. Evita sobreajuste con estrategias
Mejora el pronóstico bursátil con aumento de datos desplazados y Transformers. Resultados en VN30 y S&P 500.
Predice parámetros de ejecución en química computacional con aprendizaje activo y generativo. Modelos alcanzan 99.9% de precisión.
Descubre LiFT, un método basado en programación lineal que ajusta transformers controlando el sobreajuste, mejorando la perplejidad en GPT-2 con WikiText-2.
Descubre GENIE, un optimizador que usa el ratio OSGR para equilibrar actualizaciones de parámetros y mejorar la generalización a dominios no vistos. Supera a