GTBench: Benchmarck curricular para evaluar LLMs en teoría de grafos Nuevo benchmark curricular GTBench evalúa LLMs como asistentes en teoría de grafos. GPT-5 lidera, Llama falla. 2026-06-03 · 2 min