Actor-Critic con Kernel Guiado por SHAP para Aprendizaje por Refuerzo Explicable
Mejora la interpretabilidad del aprendizaje por refuerzo con RSA2C, un algoritmo kernelizado que usa atribuciones SHAP para entrenar actores y críticos con estabilidad y eficiencia.