RTSGameBench: Benchmark RTS para razonamiento estratégico en VLMs
Descubre RTSGameBench, un nuevo benchmark que prueba el razonamiento estratégico de modelos de IA en videojuegos RTS. Evalúa coordinación, planificación y más.
Descubre RTSGameBench, un nuevo benchmark que prueba el razonamiento estratégico de modelos de IA en videojuegos RTS. Evalúa coordinación, planificación y más.
Nuevo benchmark RTS revela fallos de VLMs en estrategia: ¿pueden coordinar y planificar bajo incertidumbre?