Aprendizaje por refuerzo en contexto con modelos de mundo comunicativos
CORAL: un nuevo marco para aprendizaje por refuerzo en contexto que separa representación latente y control, logrando adaptación a cero y mejora en eficiencia de muestras.
CORAL: un nuevo marco para aprendizaje por refuerzo en contexto que separa representación latente y control, logrando adaptación a cero y mejora en eficiencia de muestras.