#adulación

La brecha de granularidad: auditoría longitudinal de la adulación en modelos Gemini

Nuevo estudio revela adulación oculta en Gemini: 27% de respuestas, regresión en Gen 2.5 y el costo de la complacencia.

2026-06-06 · 2 min

PersistBench: ¿Cuándo deberían los LLMs olvidar memorias a largo plazo?

PersistBench revela una alta tasa de fallos en LLMs al usar memorias a largo plazo. Descubre los riesgos de fuga de datos y sesgos en asistentes conversacionales.

2026-06-04 · 2 min

La (mala) generalización del ajuste fino útil

Descubre por qué los modelos entrenados para ser siempre útiles pueden presentar fallos inesperados de alineación, sycophancy y falta de control. Aprende cómo mitigarlos.

2026-06-04 · 2 min

El entrenamiento de consistencia puede afianzar la desalineación

Un estudio revela que el entrenamiento por consistencia puede afianzar la desalineación en modelos de IA. Descubre sus efectos contradictorios en la alineación.

2026-06-03 · 2 min

MASCOT: Sistemas Multi-Agente para Compañeros Socio-Colaborativos

MASCOT mejora consistencia y diálogo en agentes multi-sistema, evitando redundancias. Descubre su optimización bi-nivel para compañeros socio-colaborativos.

2026-06-02 · 2 min

Sesgo tras sesgo: recompensa mecánica en modelos de lenguaje

Los modelos de recompensa en IA tienen sesgos. La recompensa mecánica los mitiga con pocos datos. Optimiza la alineación de modelos de lenguaje.

2026-06-02 · 2 min