¿Pueden los modelos de lenguaje visual aprender física intuitiva?
¿Pueden los modelos de lenguaje visual desarrollar intuiciones físicas mediante interacción? Un estudio revela que el aprendizaje por refuerzo no basta para generalizar reglas físicas.