Aprendizaje por imitación sin entrenamiento con políticas de difusión cerradas Aprendizaje por imitación sin entrenamiento: políticas de difusión cerradas logran inferencia en tiempo real en CPU móvil con rendimiento competitivo. 2026-06-02 · 2 min