Investigación Profunda con DecomposeR: RL y Recompensa Estructural DecomposeR optimiza la investigación profunda con RL centrado en planificador y recompensa estructural. Mejora hasta 8 puntos en benchmarks. 2026-06-03 · 2 min