RefusalBench: Evaluación generativa del refuslo selectivo en modelos de lenguaje enraizados Evalúa la capacidad de modelos de lenguaje profundos en seleccionar y rechazar palabras clave relevantes para mejorar la generación de texto en español. 2025-11-07 · 3 min