Probing satura, fragilidad resuelve: nueva métrica para LLM
La precisión del probing se satura pronto en LLM; la fragilidad revela la evolución oculta de representaciones. Descubre esta métrica complementaria.
La precisión del probing se satura pronto en LLM; la fragilidad revela la evolución oculta de representaciones. Descubre esta métrica complementaria.
Descubre cómo la falta de etiquetas protegidas afecta las auditorías de equidad en ML. Resultados revelan patrones de daño interseccional y la necesidad de calibración.
¿Cómo saber si un modelo de lenguaje genera código fiable? Un nuevo método basado en tres ejes ortogonales mejora la estimación de incertidumbre hasta un 8%.
Descubre Luminol-AIDetect: detecta texto IA sin entrenamiento. Desordena y mide perplejidad. Reduce falsos positivos 17x.
Descubre qué defensa bloquea cada amenaza OWASP LLM: filtros de rechazo caen hasta 25% ante paráfrasis, controles resisten. Estudio de atribución y fragilidad.