MA-ProofBench: Evaluación de LLMs en demostración de teoremas de análisis Descubre MA-ProofBench, el primer benchmark para demostración de teoremas en análisis matemático. LLMs solo logran 16% en nivel básico y 5% en PhD. 2026-06-15 · 2 min