Delulu: Un punto de referencia multilingüe verificado para la detección de alucinaciones de código en tareas de relleno en medio
Delulu: benchmark multilingüe para detectar alucinaciones de código en relleno en medio. Evalúa la fiabilidad de modelos generativos de IA.