ReSum: Sinergia entre Razonamiento y Resumen de LLMs con RL Descubre cómo ReSum, un nuevo marco de RL, mejora el razonamiento de LLMs un 4% y reduce el largo de las cadenas un 18.6% mediante auto-resúmenes. 2026-06-12 · 2 min