SVoT: Razonamiento Espacial Consciente del Estado con Aprendizaje por Refuerzo
SVoT mejora el razonamiento espacial en modelos multimodales mediante visualización verificable de estados intermedios con aprendizaje por refuerzo, logrando hasta un 65% más de precisión.