#mr.q

Representation learning: la clave para escalar el RL multitarea

MR.Q demuestra que las representaciones predictivas escalan el RL multitarea sin planificación, superando a modelos del mundo.