Odysseus: Escalando VLMs a la toma de decisiones de más de 100 turnos en juegos mediante aprendizaje por refuerzo
<meta name=description content=Odysseus escala VLMs a decisiones de más de 100 turnos en juegos con RL usando aprendizaje por refuerzo. Descúbrelo.>