Muestreo inicial con temple paralelo para alineación de recompensas en inferencia PATHS: temple paralelo para muestreo inicial en alineación de recompensas. Evita modas locales y explora regiones raras de alta recompensa en modelos generativos. 2026-06-01 · 3 min