ReTreVal: Razonamiento en Árbol con Validación y Memoria entre Problemas
ReTreVal permite a LLMs aprender entre problemas durante la inferencia, mejorando el razonamiento sin ajuste fino. Logra 85.8% en MATH-500 y 54.4% en MMLU-Pro.
ReTreVal permite a LLMs aprender entre problemas durante la inferencia, mejorando el razonamiento sin ajuste fino. Logra 85.8% en MATH-500 y 54.4% en MMLU-Pro.
<meta name=description content=Descubre cómo las ráfagas de retroceso afectan las cadenas largas de razonamiento. Analizamos la forma del exceso de pensamiento y su impacto en la cognición.>