Decodificando la intención de cruce peatonal con modelos de visión y lenguaje Investigación que utiliza modelos de lenguaje y visión para predecir intención de cruce peatonal desde vídeos egocéntricos, con un 14.5% más de precisión. 2026-06-16 · 2 min