#fragilidad

Probing satura, fragilidad resuelve: nueva métrica para LLM

La precisión del probing se satura pronto en LLM; la fragilidad revela la evolución oculta de representaciones. Descubre esta métrica complementaria.

2026-06-11 · 2 min

¿Qué tan confiables son las auditorías de equidad con datos no confiables?

Descubre cómo la falta de etiquetas protegidas afecta las auditorías de equidad en ML. Resultados revelan patrones de daño interseccional y la necesidad de calibración.

2026-06-09 · 1 min

Incertidumbre en código generado: más que solo texto

¿Cómo saber si un modelo de lenguaje genera código fiable? Un nuevo método basado en tres ejes ortogonales mejora la estimación de incertidumbre hasta un 8%.

2026-06-09 · 2 min

Luminol-AIDetect: Detección rápida de texto generado por IA sin entrenamiento

Descubre Luminol-AIDetect: detecta texto IA sin entrenamiento. Desordena y mide perplejidad. Reduce falsos positivos 17x.

2026-06-04 · 2 min

Cobertura OWASP LLM Top 10: atribución de defensas y fragilidad

Descubre qué defensa bloquea cada amenaza OWASP LLM: filtros de rechazo caen hasta 25% ante paráfrasis, controles resisten. Estudio de atribución y fragilidad.

2026-06-03 · 2 min