Deteniendo la similitud de logotipos: combinando embebedings de IA con descriptores de Fourier

Introducción: todo empezó en una conversación en la oficina de V-Mobile sobre logotipos nuevos que sospechosamente imitaban marcas famosas. Observamos que en muchos casos las similitudes parecían intencionadas para confundir clientes y aumentar ventas en mercados pequeños. Esto planteó una pregunta clara: se puede construir un sistema que detecte automáticamente cuando un nuevo logo copia a uno existente

El reto con herramientas basadas en IA: a primera vista parece un problema de similitud de imágenes sencillo, pero los logotipos son especiales y plantean dificultades que las soluciones generales no resuelven bien

Limitaciones de modelos populares: DINO es excelente para detección de similitud visual pero se confunde con cambios de fondo y degradados; en pruebas mostró una distancia coseno de 0.56 entre una imagen y su versión ligeramente modificada, lo que genera falsos negativos. CLIP, por su parte, crea embeddings semánticos útiles para contenido reconocible, pero con logotipos formados por curvas y formas abstractas puede dar falsos positivos porque detecta elementos semánticos similares aunque las formas geométricas sean distintas

Idea clave: mezclar enfoques. Ningún modelo individual era suficientemente fiable, así que exploramos representaciones vectoriales geométricas para complementar a DINO y CLIP

De mapa de bits a vectores: proceso de preprocesado antes de vectorizar: eliminar canal alfa para quitar transparencia, limpiar fondo con rembg, recortar colores casi blancos para evitar ruido en el trazado, limitar la dimensión máxima a 1024 píxeles, aplicar filtro de mediana para eliminar ruido y aumentar contraste para definir mejor los bordes. Tras ello se usó vtracer para convertir PNG a SVG y limitar la salida a curvas Bézier cúbicas

De curvas Bézier a descriptores: vtracer devuelve rutas como curvas Bézier cúbicas. Para comparar formas convertimos cada curva en un conjunto fijo de puntos muestreando la evaluación de la curva, aplicamos una Transformada Discreta de Fourier a la secuencia de puntos y extraemos los coeficientes de baja frecuencia como descriptores de forma. Para lograr invariancia normalizamos restando el centroide, dividiendo por escala y, opcionalmente, fijando el punto inicial para manejar rotaciones. El resultado son vectores de longitud fija comparables como embeddings

Ventaja: a diferencia de CLIP y DINO estos descriptores capturan geometría pura, lo que ayuda en comparaciones finas de forma. Problema: falsos positivos. Imágenes distintas pueden compartir curvas geométricas parecidas y producir altas similitudes geométricas. Intentos como calcular distancia de Chamfer entre curvas empeoraron el problema en algunos casos

Solución práctica: enfoque combinado. Conclusiones experimentales: DINO es poderoso pero puede generar falsos negativos; CLIP puede producir falsos positivos; los descriptores de Fourier ayudan a filtrar ruido pero son menos estables por sí solos. La estrategia efectiva fue combinar los tres métodos con pesos empíricos para aprovechar sus virtudes y mitigar debilidades

Fórmula ponderada de ejemplo: Similarity = DINO × 0.7 + CLIP × 0.2 + Fourier × 0.1. Estos pesos surgieron de pruebas y aumentaron la fiabilidad en la detección

Estrategia de búsqueda optimizada: para escalar no es necesario calcular todo para cada imagen. Proponemos un flujo por etapas: Etapa 1 usar DINO para recuperar candidatos iniciales y filtrarlos con CLIP usando umbrales que permitan detener la búsqueda si se encuentra alta similitud o si no hay coincidencias; Etapa 2 reordenar los candidatos con descriptores de Fourier; Etapa 3 opcional reordenar los mejores resultados usando distancia de Chamfer con descriptores por ruta. Antes de iniciar se pueden comprobar hashes SHA256 para detectar copias exactas y realizar búsquedas por hash perceptual para hallar modificaciones menores

Implementación de prueba: desarrollamos un prototipo que combina SQLite3 y FAISS para almacenamiento y búsqueda, guarda embeddings de DINO y CLIP, descriptores de Fourier combinados y por ruta, así como hashes SHA256 y perceptuales para cada imagen. Incluye scripts para poblar la base con imágenes PNG, un script de búsqueda y otro de comparación directa entre dos logotipos. Soporta procesamiento en GPU y CPU. El código está en desarrollo como prueba de concepto y sirve para ilustrar técnicas y decisiones

Datos de prueba: se trabajó con un subconjunto de 500 logos del Large Logo Dataset

Qué sigue: el proyecto continúa. Estamos afinando pesos, explorando más características geométricas y probando en conjuntos de datos mayores. La combinación de embeddings de IA con descriptores geométricos muestra resultados prometedores y abre caminos para mejoras adicionales

Sobre Q2BSTUDIO: en Q2BSTUDIO somos una empresa de desarrollo de software y aplicaciones a medida especializada en soluciones basadas en inteligencia artificial, ciberseguridad y servicios cloud. Ofrecemos desarrollo de software a medida y aplicaciones multiplataforma pensadas para empresas que necesitan soluciones personalizadas. Si te interesa cómo integrar IA en procesos de negocio puedes conocer nuestros servicios de IA para empresas y nuestra oferta de software a medida. También proporcionamos servicios de ciberseguridad y pentesting, migraciones y gestión en servicios cloud aws y azure, inteligencia de negocio y power bi, agentes IA y automatización de procesos

Palabras clave integradas: aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA y power bi, pensadas para mejorar el posicionamiento y visibilidad de soluciones empresariales

Conclusión y llamada a la acción: combinar embeddings de modelos de IA con descriptores geométricos ofrece un balance entre robustez y precisión para detectar similitud de logotipos. Si trabajas en protección de marca, marketplaces o necesitas integrar detección automática en tu plataforma, ponte en contacto con Q2BSTUDIO para diseñar una solución a medida que combine IA, seguridad y escalabilidad

Aviso sobre uso de IA: durante la redacción de este artículo se usó asistencia de IA para mejorar redacción y claridad, y herramientas de copiloto para secciones de cálculo; todas las decisiones técnicas, revisiones y el código fueron verificados manualmente por el equipo

Compartir

Comentarios

También te puede interesar

Krish Naik: Sesión de inducción en vivo del Ultimate RAG Bootcamp

Mejores 100 empresas de Inteligencia Artificial en Cerdanyola del Vallès

El constructor de agentes de OpenAI está loco: tutorial completo

Técnica con Tim: Dejé competir a 3 AIs para construir la misma app...

Top 5 Expertos en Inteligencia Artificial en Cerdanyola del Vallès

Comprar cuentas de Gmail - Acceso instantáneo y servicio confiable