Autoimitación Temporal: Aprendizaje por Refuerzo Eficiente
Descubre cómo Temporal Self-Imitation Learning (TSIL) optimiza tareas robóticas de largo horizonte usando la eficiencia temporal como señal de supervisión.
Descubre cómo Temporal Self-Imitation Learning (TSIL) optimiza tareas robóticas de largo horizonte usando la eficiencia temporal como señal de supervisión.