Identificar-Explotar Guiado por Árboles: Bandidos Duelistas
Descubre TG-ITE, el primer marco unificado para bandidos duelistas que logra O(N) en BAI y arrepentimiento. Optimiza identificación y explotación.
Descubre TG-ITE, el primer marco unificado para bandidos duelistas que logra O(N) en BAI y arrepentimiento. Optimiza identificación y explotación.
Descubre Low-Pass Flow Matching, un método que optimiza la generación de imágenes reduciendo el costo computacional mediante un sesgo espectral variable.
Descubre BlockGen: combina difusión uniforme y enmascarada con muestreo híbrido para generar secuencias por bloques de alta calidad. Supera modelos previos.
Descubre cómo el muestreo especulativo, inspirado en modelos de lenguaje, acelera la dinámica molecular hasta 9x sin errores.
Descubre cómo los gradientes semánticos revelan la incertidumbre de los LLM. SemGrad y HybridGrad: métodos sin muestreo para predicciones fiables.
Nueva demostración de cotas de arrepentimiento sensibles a la varianza para el muestreo de Thompson en bandidos lineales generalizados. Análisis teórico que supera limitaciones previas.
Moment-Video evalúa la capacidad de MLLM para captar eventos visuales que duran solo unos fotogramas. Resultados sorprendentes.
Descubre el blindaje robusto para RL seguro. Garantiza seguridad en MDPs con transiciones inciertas mediante lógica temporal. Ideal para alta incertidumbre.
Optimiza el submuestreo en compresión de sensores con modelos generativos de flujo. Logra reconstrucciones de imágenes de alta calidad con solo el 5% de datos. Ideal para MRI.
Mejora la detección de intrusiones IoT con SMOTE y evaluación multi-modelo. Alcanza F1 de 0.9989 usando Random Forest en datos de potencia.
Descubre cómo los Strong Stochastic Flow Maps revolucionan el muestreo en modelos de difusión, permitiendo generar imágenes y simular sistemas moleculares en pocos pasos.
FTDiff usa RL para ajustar modelos de difusión y generar moléculas válidas para diseño de fármacos basado en estructura.
POPO elimina muestras ineficaces acelerando el fine-tuning de LLM para razonamiento matemático, planificación y geometría visual con menos rollouts.
Descubre MINTS, algoritmo de Muestreo Thompson minimalista que logra arrepentimiento casi óptimo en bandidos con restricciones. Ideal para IA y decisiones.
Descubre cómo un nuevo sesgo implícito en espacios generativos acelera hasta 37x la emulación de dinámica de proteínas, aumentando diversidad y cubriendo más estados de baja energía.
Descubre cómo MS-PAFL mejora la privacidad en aprendizaje federado sin sacrificar precisión, usando división de modelos y ruido calibrado. Logra modelos precisos con fuertes garantías.
Descubre cómo el Monte Carlo secuencial reforzado mejora el muestreo amortizado de distribuciones complejas. Entrenamiento off-policy y temperado adaptativo para mayor precisión.
PATHS: temple paralelo para muestreo inicial en alineación de recompensas. Evita modas locales y explora regiones raras de alta recompensa en modelos generativos.
SITA: annealing escalable que evita divergencias para muestreo molecular eficiente. Lider en alanina dipeptido y tripeptido.
Descubre cómo la caminata verdadera auto-evitativa reduce el error de estimación integral en MCMC de t^-1/2 a O(√log t/t), acelerando la convergencia.