#retroceso

ReTreVal: Razonamiento en Árbol con Validación y Memoria entre Problemas

ReTreVal permite a LLMs aprender entre problemas durante la inferencia, mejorando el razonamiento sin ajuste fino. Logra 85.8% en MATH-500 y 54.4% en MMLU-Pro.

2026-06-06 · 2 min

La forma del exceso de pensamiento: ráfagas de retroceso en trazas largas de razonamiento

2026-05-29 · 1 min