EvoCode-Bench: Evaluando Agentes de Codificación en Interacciones Iterativas de Múltiples Turnos
EvoCode-Bench evalúa agentes de codificación en entornos interactivos iterativos. Descubre métricas y resultados para mejorar el rendimiento de asistentes de programación.