#composición cero-shot

Representación Terminal en Aprendizaje por Refuerzo

Descubre la Representación Terminal (TR), una nueva formulación en RL que elimina la necesidad de eigenvectores para tareas como descubrimiento de opciones y tr

2026-06-01 · 3 min