#percepción fina

FineGen: Marco multiagente basado en VLM para datasets detallados

Descubre FineGen, un marco multiagente basado en VLM que construye datasets de imagen-texto con muestras negativas duras, logrando un 96.7% de validez y +14.4%

2026-06-16 · 3 min

El último píxel visible: sondeando percepción fina en VLMs

Nuevo benchmark FineSightBench revela que la percepción fina en VLMs satura a 12px y el razonamiento visual es limitado.

2026-06-16 · 2 min

El último píxel visible: probando la percepción fina en VLMs

¿Qué tan pequeño puede percibir un VLM? FineSightBench revela que la percepción se satura a 12px, pero el razonamiento sigue limitado.

2026-06-16 · 2 min