#mllm

Comparativa de MLLMs en generación de código para webs interactivas

WebIGBench evalúa MLLMs en generar código de páginas web con interacciones complejas. Descubre los resultados y límites actuales. ¡Lee más!

2026-06-02 · 2 min

Jailbreaking en MLLMs usando video multi-clip

¿Sabías que los modelos de IA multimodales son más vulnerables a ataques con video que con imágenes? Un estudio revela cómo el video multi-clip aumenta el éxito de los jailbreaks.

2026-06-02 · 2 min

MLLM-Microscope: Desvelando la Estructura Interna de los MLLMs

Descubre cómo MLLM-Microscope analiza las representaciones internas de los MLLMs, revelando linealidad, dimensión y anisotropía para mejorar el diseño futuro.

2026-06-02 · 1 min

Agente web automejorado mediante exploración cognitiva

SCALE permite a agentes web automejorar mediante exploración cognitiva, superando limitaciones en entornos dinámicos. Mejora el rendimiento de MLLMs.

2026-06-01 · 1 min

PRISM: Selección Intrínseca de Datos Multimodales sin Entrenamiento

Descubre PRISM, un método que selecciona datos de instrucción visual sin entrenamiento, reduciendo costes y mejorando el rendimiento de modelos multimodales.

2026-06-01 · 2 min

Explicar es más difícil que predecir solo: Evaluando explicaciones basadas en conceptos de MLLMs como clasificadores visuales ICL

Análisis de la dificultad de explicar frente a predecir en MLLMs visuales con ICL. Evaluación de la calidad de explicaciones conceptuales en modelos multimodales.

2026-05-29 · 1 min