#generative evaluation

RefusalBench: Evaluación generativa del refuslo selectivo en modelos de lenguaje enraizados

Evalúa la capacidad de modelos de lenguaje profundos en seleccionar y rechazar palabras clave relevantes para mejorar la generación de texto en español.

2025-11-07 · 3 min