QHyer: Transformer híbrido de atención-mamba condicionado por Q para RL offline condicionada por objetivos
QHyer: Transformer híbrido atención-mamba condicionado por Q para RL offline por objetivos. Modelo eficiente que mejora el aprendizaje por refuerzo offline orientado a metas.