#olimpiada

Riemann-Bench: benchmark de matemáticas de investigación

Nuevo benchmark Riemann-Bench: la IA solo alcanza menos del 10% en matemáticas de investigación. ¿Qué tan lejos están de los humanos?

2026-06-17 · 2 min

Escape del Pozo Cognitivo: Matemáticas de Competencia con Modelos Comerciales

Nuevo pipeline logra 67.1% en problemas de la Olimpiada Matemática por solo $31 por pregunta, superando a modelos costosos y estableciendo un nuevo estado del

2026-06-16 · 2 min

MaxProof: Demostraciones matemáticas escalables con RL generativo-verificador

Descubre MaxProof: RL generativo-verificador y escalado poblacional para récords en olimpiadas. Supera humanos en IMO y USAMO.

2026-06-12 · 1 min

ComBench: nuevo benchmark de combinatoria olímpica para IA

ComBench: el mejor modelo solo alcanza 65.4% en problemas de combinatoria olímpica. Descubre las brechas.

2026-06-10 · 2 min