Gradiente de Política Determinista para Control con Inconsistencia Temporal Algoritmo de gradiente de política determinista para aprender equilibrios en control con inconsistencia temporal. Aplicaciones en carteras y seguimiento óptimo. 2026-06-11 · 2 min