PhyGround: Evaluación comparativa del razonamiento físico en modelos de mundo generativos Descubre PhyGround, un benchmark que evalúa el razonamiento físico en modelos generativos. Analiza su rendimiento y limitaciones. 2026-05-15 · 1 min