ProcessThinker: mejora el razonamiento multimodal con recompensas de proceso ProcessThinker mejora el razonamiento multimodal mediante recompensas de proceso paso a paso, sin entrenar un PRM. Supera en benchmarks de video. 2026-06-11 · 2 min