#optimización de política suave variacional