Política de Deriva Implícita: acciones en un paso con geometría condicional
IDP: genera acciones en un paso con corrección del entrenamiento usando geometría condicional de experto. Ideal para control robótico de alta frecuencia.
IDP: genera acciones en un paso con corrección del entrenamiento usando geometría condicional de experto. Ideal para control robótico de alta frecuencia.