TEVI: Edición de representaciones visuales con autoencoders dispersos para alinear visión y lenguaje
Descubre TEVI, un método que usa autoencoders dispersos para editar embeddings visuales y mejorar la alineación entre imágenes y texto en modelos como CLIP. Mejora la recuperación y robustez.