Aprendizaje por refuerzo en contexto con modelos de mundo comunicativos CORAL: un nuevo marco para aprendizaje por refuerzo en contexto que separa representación latente y control, logrando adaptación a cero y mejora en eficiencia de muestras. 2026-06-09 · 2 min