#rsa2c

Actor-Critic con Kernel Guiado por SHAP para Aprendizaje por Refuerzo Explicable

Mejora la interpretabilidad del aprendizaje por refuerzo con RSA2C, un algoritmo kernelizado que usa atribuciones SHAP para entrenar actores y críticos con estabilidad y eficiencia.

2026-06-08 · 2 min