#comprensión multimodal

SVHalluc: Evaluación de alucinaciones voz-visión en modelos AV

SVHalluc: nuevo benchmark para alucinaciones voz-visión en LLMs audiovisuales. Modelos fallan en alineación semántica y temporal.

2026-06-03 · 1 min

DraDDP: Dataset multimodal para análisis de discurso en diálogos multipartes

Descubre DraDDP, el primer dataset multimodal público para analizar discurso en diálogos multipartes. Basado en series de TV, impulsa la IA conversacional.

2026-06-02 · 2 min