Garantías probabilísticas de rendimiento para refuerzo multitarea
Descubre garantías de rendimiento para políticas multitarea en tareas no vistas. Método que combina rollouts y generalización con alta confianza.
Descubre garantías de rendimiento para políticas multitarea en tareas no vistas. Método que combina rollouts y generalización con alta confianza.