LP-DS: Dirección de difusión con perturbación lagrangiana
LP-DS optimiza políticas generativas congeladas mediante perturbaciones en el espacio de ruido, logrando hasta un 25% más de retorno en robótica y locomoción.
LP-DS optimiza políticas generativas congeladas mediante perturbaciones en el espacio de ruido, logrando hasta un 25% más de retorno en robótica y locomoción.