Parada Óptima Continua mediante Aprendizaje por Refuerzo Profundo
CARLOS: un nuevo algoritmo de RL en tiempo continuo que supera a los solvers Bermudas, acercándose al límite superior americano con alta eficiencia.
CARLOS: un nuevo algoritmo de RL en tiempo continuo que supera a los solvers Bermudas, acercándose al límite superior americano con alta eficiencia.
CARLOS: algoritmo de RL profundo para parada óptima en tiempo continuo sin discretización, mejorando precisión y eficiencia en valoración de opciones.