Colaboración adaptable con humanos: optimización de políticas metacognitivas para LLMs multiagente con aprendizaje continuo
Optimización de políticas metacognitivas en entornos de múltiples agentes para mejorar el aprendizaje y la toma de decisiones.