Representation learning: la clave para escalar el RL multitarea MR.Q demuestra que las representaciones predictivas escalan el RL multitarea sin planificación, superando a modelos del mundo. 2026-06-05 · 2 min