Escalado de datos multi-salto con selección de rutas restringida por grafos
Descubre cómo generar datos de entrenamiento multi-salto a escala usando restricciones de grafos, mejorando el razonamiento compuesto en LLMs. Resultados: Token F1 del 38.58% en contratos legales.