Revelando sesgos ocultos en modelos texto-imagen con búsqueda automática
Descubre cómo el marco BGPS automatiza la búsqueda de prompts para exponer sesgos ocultos en modelos de texto a imagen como Stable Diffusion.
Descubre cómo el marco BGPS automatiza la búsqueda de prompts para exponer sesgos ocultos en modelos de texto a imagen como Stable Diffusion.
Añadir contexto mínimo altera predicciones de género en modelos de lenguaje, rompiendo su invariancia. Impacto en sesgos y aplicaciones críticas.
Descubre cómo los LLMs de 2024 muestran sesgos de género, raza y edad en ocupaciones y crímenes, revelando una paradoja de desviación que afecta su fiabilidad.