Algoritmo de adaptación de covarianza para semibandidos con aplicación a recompensas dispersas
Algoritmo de adaptación de covarianza para optimizar problemas con recompensas dispersas. Aprende a ajustar eficientemente la matriz de covarianza en entornos de aprendizaje automático.