Indistinguibilidad conductual acotada para destilación de LLM
¿Es suficiente la similitud semántica para destilar LLMs? Evaluamos indistinguibilidad conductual con adversarios y consultas acotadas. Resultados clave con Qwen y Llama.
¿Es suficiente la similitud semántica para destilar LLMs? Evaluamos indistinguibilidad conductual con adversarios y consultas acotadas. Resultados clave con Qwen y Llama.
<meta content=SciIntBench evalúa adversarialmente el cumplimiento de normas de integridad en LLMs. Descubre cómo este benchmark mide la fiabilidad y ética de los modelos de lenguaje.>