Preferencias Coordinadas en Aprendizaje por Refuerzo Multiagente Multiobjetivo Descubre cómo el algoritmo PCMA coordina preferencias entre agentes para optimizar múltiples objetivos en entornos cooperativos, mejorando rendimiento y trade-offs. 2026-06-15 · 2 min