Atribución de ruta dual: Atribución eficiente para SwiGLU-Transformers a través de la propagación de objetivos por capa
Una metodología eficiente para la atribución de rutas duales en SwiGLU-Transformers mediante propagación de objetivos por capas.
Una metodología eficiente para la atribución de rutas duales en SwiGLU-Transformers mediante propagación de objetivos por capas.