Sesgo de Pico Mediado por Trazas en RL El Sesgo de Pico por Trazas (TMPB) distorsiona la valoración en RL profundo. La optimización adaptativa lo corrige. Implicaciones para IA y neurociencia. 2026-06-04 · 2 min