#janus

JANUS: Evaluando la distorsión informativa en modelos de lenguaje

Descubre JANUS, un benchmark que mide cómo los LLMs distorsionan hechos al omitir evidencia adversa o enfatizar detalles favorables. Resultados reveladores.

2026-06-10 · 2 min

Auditorías de fallos calibradas con señuelos para modelos de lenguaje

Janus audita fallos en modelos de lenguaje: calibra con señuelos y replica en datos nuevos para confirmar solo los errores genuinos. Descubre el método.

2026-06-09 · 2 min