Cuantificación de incertidumbre en estructuras con PCE y aprendizaje activo
Mejora la precisión de modelos sustitutos en ingeniería con expansión en caos polinomial y aprendizaje activo multivariante. Reduce costos computacionales.
Mejora la precisión de modelos sustitutos en ingeniería con expansión en caos polinomial y aprendizaje activo multivariante. Reduce costos computacionales.
Descubre cómo eliminar la necesidad de grupos en RLVR sin crítico usando filtrado de tokens negativos, logrando entrenamiento estable con un solo rollout.
Operator Boosting reduce parámetros hasta un 95% y mejora la precisión en sustitutos neuronales de PDE. Optimiza FNO, DeepONet y CNO con aprendizaje residual.
Descubre CheckMIABench, el nuevo benchmark para evaluar ataques de inferencia de membresía en LLMs. Mejora la privacidad de tus modelos con bases sólidas.
Descubre ReLAR: marco que refina estados ocultos de LLMs con aprendizaje por refuerzo, mejorando precisión y estabilidad sin cadenas de pensamiento.
Descubre MGUP, un nuevo mecanismo de actualización selectiva que acelera y estabiliza el entrenamiento de modelos de IA. Integrable con AdamW, Lion y Muon.
Descubre cómo CREST corrige la dilución temporal en modelos dinámicos, reanclando crédito de eventos sin etiquetas para lecturas globales robustas.
Mejora el éxito de agentes LLM con EnvRL al aprender dinámicas del entorno. Resultados: +10% en ALFWorld y WebShop.
Descubre cómo recuperar dominios y señales ocultas de datos corruptos sin supervisión, usando simetrías. Nuevo método para problemas inversos ciegos.
Descubre cómo los LLMs mejoran sin supervisión usando memorias latentes ligeras, superando al reentrenamiento completo. ¡Optimización eficiente!
Aprende a clasificar modelos OCC con correlación de ranking y vecino cercano. Alta precisión en datasets y algoritmos. Código público.
AIMER es un método sin calibración para podar expertos en modelos MoE, reduciendo memoria y costos. Logra balance de capacidad en tareas, solo 0.22s.
Descubre cómo los sesgos estructurales impactan la evaluación de modelos de uplift. TARNet se destaca por su robustez. Aprende sobre métricas estables y ATE.
Descubre cómo los modelos de visión-lenguaje identifican promociones ilícitas de juegos inseguros para menores. UGCG-Guard logra un 94% de precisión.
Descubre cómo un marco de estabilización basado en pesos evita el colapso en modelos generativos recursivos. El peso óptimo para datos reales es el inverso del
Descubre cómo los sistemas dinámicos explican el comportamiento de redes neuronales: propagación, entrenamiento, estabilidad y límites de campo medio.
Mejora la evaluación de riesgos con modelos de supervivencia que manejan retrasos censurados. Descubre nuestro método con aprendizaje por transferencia.
Descubre cómo los LLMs logran coordinarse sin hablar, superando a humanos en ciertos escenarios, pero fallando en tareas numéricas y culturales. Estudio
Evaluación cero-shot de cinco modelos de navegación visual en entornos reales. Fallos en colisiones, reconocimiento y robustez. ¡Lee las lecciones!
Descubre cómo el modelo TRAM-DAG estima el beneficio individual de la trombectomía en ictus, validado con ensayos clínicos. Personalización del tratamiento