FM-IRL: Flow-Matching para modelado de recompensas y regularización en RL
Descubre cómo FM-IRL combina Flow-Matching con RL para mejorar la exploración y generalización en políticas de aprendizaje por refuerzo.
Descubre cómo FM-IRL combina Flow-Matching con RL para mejorar la exploración y generalización en políticas de aprendizaje por refuerzo.
Descubre cómo las simetrías no compactas mejoran las cotas de generalización en PAC-Bayes. Experimentos validan la teoría.
¿Pueden los modelos de lenguaje visual desarrollar intuiciones físicas mediante interacción? Un estudio revela que el aprendizaje por refuerzo no basta para generalizar reglas físicas.
Descubre cómo NeVA alinea valores en LLMs con edición neuronal, evitando fugas indeseadas. Control fino sin reentrenamiento.
Descubre por qué no existen límites computables de generalización de longitud para transformers y C-RASP, y cómo afecta al aprendizaje automático.
Descubre cómo obtener garantías formales de rendimiento en aprendizaje por refuerzo multitarea para tareas no vistas, incluso con pocos datos.
Descubre garantías de rendimiento para políticas multitarea en tareas no vistas. Método que combina rollouts y generalización con alta confianza.
Descubre cómo la adaptación de ruido semi-supervisada (SSNA) utiliza ruido sintético para mejorar la generalización de modelos de aprendizaje automático. ¡Optimiza tu rendimiento!
SafeMoE aprovecha conocimiento inseguro para respuestas seguras e informativas, superando en un 20% la tasa de seguridad. Un nuevo paradigma en alineamiento.
Descubre cómo UME revoluciona la predicción ETA multi-dominio con meta-aprendizaje, logrando zero-shot y superando cold-start y falta de datos.
Aprende cómo las funciones de confianza filtran etiquetas débiles para lograr generalización casi sin pérdidas. Mejora tu IA.
Descubre FSA: método que transforma características en dinámicas para predecir series temporales nunca vistas, superando a Transformers con menos datos.
Aprende sobre un nuevo método SVM para regresión cuantílica con colas pesadas, ideal para extrapolar cuantiles extremos. Resultados en datos del río Danubio.
Descubre cómo GROKtimizer logra una generalización rápida tras la interpolación, combinando convergencia veloz y minimización de normas con momento críticamente amortiguado.
Descubre el aprendizaje en todas partes: IA con restricciones puntuales mejora generalización mediante dualidad.
Estudio de estabilidad en generalización para optimización distribuida con momentos ortogonalizados y muestreo de clientes. Se derivan cotas finitas bajo heterogeneidad de datos.
Descubre cómo DenseMLLM permite a los LLM multimodales estándar realizar predicciones densas sin decodificadores adicionales. Resultados competitivos en segmentación y profundidad.
Descubre un nuevo framework que aprende a detectar anomalías en grafos dinámicos con pocos datos etiquetados, logrando alta precisión y generalización.
AffordGen genera datos diversos para manipulación robótica con generalización zero-shot. Aumenta la eficiencia del aprendizaje por imitación.
Descubre cómo el fenómeno Grokking aparece en el preentrenamiento de LLMs, revelando una generalización gramatical retardada. Análisis de conceptos y atención en cabezas.