FeynmanBench: Evaluación de rendimiento de modelos de lenguaje multimodal en razonamiento físico diagramático
Metadescripción: Descubre cómo se evalúan los modelos de lenguaje multimodal en el razonamiento físico diagramático y su rendimiento en esta área de estudio.