#benchmarks de código

Kimi K2.7-Code: ¿30% menos tokens? Los benchmarks no lo confirman

Moonshot AI lanza Kimi K2.7-Code con un 30% menos de tokens de razonamiento. ¿Mantiene el rendimiento en benchmarks independientes? Descúbrelo aquí.

BenchEvolver transforma benchmarks saturados en problemas de código más difíciles, mejorando evaluación de IA con evolución centrada en soluciones.