#marl

MACCA: Aprendizaje por Refuerzo Multiagente Offline con Asignación Causal

Descubre MACCA, un nuevo marco de MARL offline que asigna crédito causal de forma precisa. Mejora el rendimiento en entornos sin interacción.

2026-06-02 · 2 min

MARL distribuido en red para control de consenso de cuadricópteros

Descubre cómo el MARL distribuido en red controla enjambres de cuadricópteros con escalabilidad zero-shot: entrena 3 agentes y despliega hasta 250. ¡Lee más!

2026-06-02 · 4 min

SortingHat: Redefiniendo la educación en SO con IA

Descubre cómo SortingHat, un asistente digital con IA, transforma la educación en sistemas operativos con aprendizaje personalizado y evaluación automática.

2026-06-02 · 2 min

Compensación de Retardo Desacoplada: Mejora de Políticas MARL Pre-entrenadas mediante Filtrado de Dinámicas Aprendidas

Método de optimización MARL que combina compensación de retardo desacoplada y filtrado de dinámicas aprendidas para mejorar la eficiencia en sistemas multiagente.

2026-05-27 · 1 min