CodeGolf Bench: benchmark multilingüe de generación concisa de código en LLMs
CodeGolf Bench: benchmark dinámico para evaluar LLMs en generación de código conciso en 60 lenguajes. Modelos de razonamiento lideran en eficiencia.
CodeGolf Bench: benchmark dinámico para evaluar LLMs en generación de código conciso en 60 lenguajes. Modelos de razonamiento lideran en eficiencia.