Dilema representación-racionalización en aprendizaje de recompensas
Descubre el dilema entre representación y racionalización en RLHF: cómo el embedding afecta la consistencia de las recompensas y los límites de la optimización.
Descubre el dilema entre representación y racionalización en RLHF: cómo el embedding afecta la consistencia de las recompensas y los límites de la optimización.
Descubre cómo los modelos de IA generan razonamientos contradictorios y aparentemente lógicos. Hasta 13% de fallos en modelos comerciales. El Chain-of-Thought no es siempre fiable.