#100 turnos

Odysseus: Escalando VLMs a la toma de decisiones de más de 100 turnos en juegos mediante aprendizaje por refuerzo

Odysseus: Escalando VLMs a la toma de decisiones de más de 100 turnos en juegos mediante aprendizaje por refuerzo

<meta name=description content=Odysseus escala VLMs a decisiones de más de 100 turnos en juegos con RL usando aprendizaje por refuerzo. Descúbrelo.>

2026-05-04 · 1 min