La comprensión de la narrativa visual en cómics y mangas representa un desafío único, especialmente para las personas con discapacidad visual. Aunque la tecnología ha avanzado enormemente en la interpretación de imágenes, la transición de estas representaciones gráficas a un formato accesible sigue siendo problemática. Una de las lecciones más destacadas en este campo es que la similitud semántica, o el grado en que una máquina puede 'entender' el contenido de una imagen, no siempre se traduce en una comprensión efectiva de la historia que se quiere contar.

Los sistemas basados en modelos de visión y lenguaje han demostrado capacidad para analizar imágenes, sin embargo, su enfoque suele centrarse en partes individuales, como los paneles, en lugar de abordar la página en su totalidad. Esto es crítico, ya que cada página en un cómic no solo contiene una serie de imágenes, sino que también desarrolla una narrativa más amplia que requiere una interpretación conjunta. Este enfoque fragmentado puede dar lugar a lo que se denomina alucinaciones en el contexto de los modelos de inteligencia artificial, donde se generan interpretaciones incorrectas o inexactas de los elementos visuales.

Desde Q2BSTUDIO, reconocemos la importancia de diseñar soluciones de software que realmente atiendan la diversidad de necesidades. Al desarrollar aplicaciones a medida que integren capacidades de inteligencia artificial, podemos trabajar hacia un futuro donde la narración visual sea accesible para todos. Esto implica avanzar en la creación de modelos de inteligencia artificial que no solo identifiquen objetos, sino que lo hagan con un contexto narrativo claro y útil.

Los desafíos que presenta la interpretación de cómics nos enseñan sobre la naturaleza del entendimiento en sí. Un modelo puede describir lo que ve, pero es necesario desarrollar un sistema que pueda conectar esos puntos de manera que tenga sentido para el lector. Esto refleja un área de oportunidad para aquellas empresas que buscan soluciones innovadoras en inteligencia de negocio y que deseen incluir la accesibilidad en su chapa innovadora.

Finalmente, es esencial abordar estos desafíos con un enfoque holístico, considerando la curación de datos y el entrenamiento adecuado de los modelos de inteligencia artificial. En Q2BSTUDIO, proponemos estrategias que no solo mejoran esta interpretación, sino que también permiten a las empresas optimizar sus datos y asegurar que la narrativa que cuentan sea clara y concreta, creando así un impacto significativo en la vida de aquellos que consumen contenido visual.