Misma carga, distinto canal: la asimetría de seguridad en LLMs
Descubre cómo los LLMs reaccionan distinto ante contenido malicioso según si llega por usuario, metadatos o salidas de herramientas. Un estudio revela una asimetría de confianza.
Descubre cómo los LLMs reaccionan distinto ante contenido malicioso según si llega por usuario, metadatos o salidas de herramientas. Un estudio revela una asimetría de confianza.