MoReBench: Evaluando el razonamiento moral en modelos de lenguaje
Descubre MoReBench: 1,000 escenarios morales para evaluar el razonamiento procedural y pluralista de los modelos de lenguaje.
Descubre MoReBench: 1,000 escenarios morales para evaluar el razonamiento procedural y pluralista de los modelos de lenguaje.
¿Los LLM fallan en razonamiento moral? Un estudio revela que sus rúbricas morales superan expectativas. Descubre la competencia moral optimista de la IA.
¿Los LLMs son malos en razonamiento moral? Un nuevo análisis del dataset MoReBench sugiere que son más competentes de lo que se creía. Descubre los detalles.