Representación Terminal en Aprendizaje por Refuerzo Descubre la Representación Terminal (TR), una nueva formulación en RL que elimina la necesidad de eigenvectores para tareas como descubrimiento de opciones y tr 2026-06-01 · 3 min