#overcooked

NestRL: Régimen de entrenamiento anidado para equipo humano-IA

NestRL optimiza la colaboración humano-IA mediante entrenamiento anidado, logrando mayor adaptabilidad y rendimiento frente a métodos tradicionales en Overcooked.

2026-06-02 · 2 min

Cómo los LLMs diseñan recompensas en RL cooperativo multiagente

Aprende cómo los LLMs mejoran el diseño de recompensas en RL cooperativo multiagente, logrando mayor rendimiento en Overcooked.

2026-06-02 · 2 min