Elecciones instrumentales: midiendo la propensión de los agentes LLM a perseguir comportamientos instrumentales
<meta content=Descubre cómo medir la propensión instrumental en agentes LLM. Métricas clave para evaluar comportamientos peligrosos y alineación en modelos de lenguaje.>