#matemáticas formales

TheoremBench: Evaluación de LLMs en demostración de teoremas matemáticos formales

TheoremBench evalúa LLMs en Lean4 con teoremas clásicos y subteoremas. Mide cobertura y eficiencia para revelar debilidades en razonamiento formal.

2026-06-09 · 2 min

LEAP: Potenciando LLMs para matemáticas formales con marcos agentivos

Descubre cómo LEAP, un marco agentivo, potencia LLMs para resolver problemas formales de matemáticas, superando récords en competiciones como Putnam e IMO.

2026-06-03 · 2 min