RankLLM: Clasificación ponderada de LLM midiendo la dificultad de preguntas
Cuantifica la dificultad de preguntas para evaluar LLMs con precisión. RankLLM logra un 90% de concordancia con evaluaciones humanas.
Cuantifica la dificultad de preguntas para evaluar LLMs con precisión. RankLLM logra un 90% de concordancia con evaluaciones humanas.