#acsac

ACSAC: Actor-Crítico con Tamaño de Chunk Adaptativo y Red Q de Transformer Causal

ACSAC: algoritmo de aprendizaje por refuerzo que combina Actor-Crítico con tamaño de chunk adaptativo y Q-Transformer causal para optimizar políticas de forma eficiente.

2026-05-13 · 2 min