#espacial

Evaluación conductual y representacional de agentes de lenguaje con objetivos

Evaluamos la direccionalidad a objetivos en agentes de lenguaje con análisis conductual y representacional. Descubre cómo entender su comportamiento.

2026-06-01 · 3 min

Búsqueda geoespacial: más allá del SIG tradicional

El 18% de las búsquedas web son geoespaciales. Nuevo estudio revela que la mayoría escapa a los SIG tradicionales. Conoce la taxonomía de 88 categorías.

2026-06-01 · 2 min

MechVQA: Evaluando LLMs multimodales en dibujos mecánicos

MechVQA: el primer dataset completo para evaluar LLMs multimodales en dibujos mecánicos. Supera a modelos cerrados con un 7.57% de precisión extra.

2026-06-01 · 2 min

SpatialAct: Probando el razonamiento-acción espacial de VLMs

Los VLMs son buenos en razonamiento espacial pero fallan en interacciones multiturno. SpatialAct revela la brecha entre percepción y acción en 3D.

2026-06-01 · 3 min

ERGeoBench: Benchmark de geolocalización encarnada en MLLMs

ERGeoBench evalúa la geolocalización encarnada de modelos multimodales usando razonamiento espacial y percepción visual. Descubre sus limitaciones.

2026-06-01 · 1 min

Cohetes que explotan y precios de hardware que se disparan conforman una pésima nueva normalidad

2026-06-01 · 2 min