Más allá de una sola explicación de la brecha Adam-SGD
Descubre por qué no existe una única explicación para la brecha Adam-SGD. Estudio empírico revela factores clave: tamaño de lote y arquitectura.
Descubre por qué no existe una única explicación para la brecha Adam-SGD. Estudio empírico revela factores clave: tamaño de lote y arquitectura.
Descubre LESS, un nuevo método de representaciones locales para imagen táctil que permite reconstrucción 3D con palpación humana y aprendizaje auto-supervisado.
Descubre cómo las redes neuronales mejoran la calidad de compresión de datos científicos, pero no aumentan la relación de compresión.
MUFFLe comprime en aprendizaje federado con deduplicación. Logra 92.93% precisión con solo 38 MB, superando a cuantización y sparsificación.
Descubre cómo dos LLMs mejoran mutuamente mediante destilación conjunta y retroalimentación entre pares, logrando una mejora Pareto en múltiples dominios.
Un modelo teórico revela cómo los transformers MoE enrutan tareas a expertos especializados, respaldado por experimentos. ¡Entiende el mecanismo!
Descubre EM-NeSy, un método que combina redes neuronales y razonamiento simbólico usando el algoritmo EM, mejorando escalabilidad y eficiencia en IA.
Aprende cómo PS2-RL logra políticas de RL seguras y escalables sin sacrificar rendimiento. Un avance para la robótica y la IA confiable.
Descubre cómo un marco de ML y estadística detecta umbrales operativos y optimiza el despacho de hidrógeno multienergía, usando datos reales de un año.
Descubra cómo los residuos de difusión en grafos mejoran la estimación de variables instrumentales, superando a métodos tradicionales en 32 de 54 pruebas sintéticas.
¿Cómo mejoran las sondas ruidosas sublineales el regret en optimización convexa online? Descubre este novedoso modelo y sus aplicaciones a la predicción con expertos.
Descubre cómo seleccionar las direcciones de incertidumbre clave en optimización robusta afín con un método voraz que garantiza una cobertura óptima del 63%.
Descubre cómo optimizar la exploración en datos complejos con estrategias adaptativas y garantías teóricas. Resultados en datos de transporte reales.
Ningún modelo bioacústico lo captura todo. Descubre qué rasgos del habla codifica cada uno y cómo elegir según tu tarea.
Descubre μ0, un modelo de mundo 3D escalable que predice trayectorias de interacción para el aprendizaje robótico sin necesidad de acciones etiquetadas.
Convierte puntuaciones de anomalías en significancias válidas y corrige el efecto look-elsewhere. Calibración conforme elimina falsas alarmas en nueva física.
μ0: modelo de mundo escalable que predice trayectorias 3D para robótica sin etiquetas. Ideal para manipulación cross-embodiment.
La calibración conforme convierte puntuaciones de anomalías en significancias válidas, eliminando falsas alertas en búsquedas de nueva física. Auditable.
Descubre FlowMo-WM, un modelo que predice movimiento de robots acuáticos con deriva oculta, mejorando precisión a largo plazo.
Descubre FlowMo-WM, un modelo visual que predice movimientos de robots acuáticos considerando inercia y corrientes ocultas. Mejora el control autónomo en entornos dinámicos.