Política de Difusión Ambiental: Aprendizaje por Imitación con Datos Subóptimos
Descubre cómo Ambient Diffusion Policy aprende de datos subóptimos en robótica. Mejora el rendimiento hasta un 33% usando solo características útiles de demostraciones de baja calidad.