Rechazo ciego: los modelos de lenguaje se niegan a ayudar a los usuarios a evadir reglas injustas, absurdas e ilegítimas
Los modelos de lenguaje se niegan a ayudar a los usuarios a eludir reglas injustas, protegiendo la integridad de las normas establecidas en diferentes plataformas.