SHAPO: Optimización de Políticas con Agudeza para Exploración Segura Descubre SHAPO, un método de optimización de políticas que mejora la exploración segura en aprendizaje por refuerzo, reduciendo riesgos en entornos críticos. 2026-06-10 · 2 min