Aprendizaje por refuerzo para imitación multimodal robusta ante sensores faltantes ¿Cómo lograr imitación robótica robusta incluso cuando fallan sensores? RL4IL usa aprendizaje por refuerzo y fusión suave. Supera métodos previos. 2026-06-16 · 3 min