#ogbench

Zero-Shot Off-Policy: Aprendizaje sin Entrenamiento

Nueva técnica de aprendizaje off-policy con zero-shot adapta políticas óptimas sin reentrenamiento, usando sucesores y densidades estacionarias. Benchmark en ExoRL y OGBench.

2026-06-02 · 2 min

Aprendizaje Off-Policy con Zero-Shot

Aprende cómo el método Zero-Shot Off-Policy Learning permite adaptar políticas a nuevas tareas sin reentrenamiento, usando medidas sucesoras y corrección de distribución para una rápida adaptación.

2026-06-02 · 1 min