Cuando dudes, planifica: SLM comprometido para RL reactivo PACT combina un modelo de lenguaje pequeño con RL reactivo para planificación deliberativa, superando a métodos tradicionales en entornos desafiantes. 2026-06-16 · 2 min