MaxProof: Demostraciones matemáticas escalables con RL generativo-verificador
Descubre MaxProof: RL generativo-verificador y escalado poblacional para récords en olimpiadas. Supera humanos en IMO y USAMO.
Descubre MaxProof: RL generativo-verificador y escalado poblacional para récords en olimpiadas. Supera humanos en IMO y USAMO.
Descubre Trellis, que usa LLMs para refinar pruebas matemáticas iterativamente y alcanzar demostraciones rigurosas en Lean.