IntentVLM: Reconocimiento de Intenciones de Vocabulario Abierto mediante Modelado Directo-Inverso con Modelos de Video-Lenguaje
Descubre IntentVLM, un innovador modelo que reconoce intenciones humanas en video con vocabulario abierto usando modelos de video-lenguaje.