#embeddings

Clasificación de sonidos ambientales con difusión en espacio de embeddings

Descubre cómo los modelos de difusión superan a métodos previos en clasificación zero-shot de sonidos ambientales, mejorando la generalización a clases no vistas.

2026-06-02 · 2 min

Reconstruir contenido con atención colaborativa mejora embeddings multimodales

Mejora la calidad de embeddings multimodales con atención colaborativa y reconstrucción de contenido para tareas de recuperación y clasificación.

2026-06-02 · 2 min

Topología y texto importan: Detección OOD en grafos con texto usando LLMs

Descubre LG-Plug, un marco plug-and-play que alinea topología y texto para detectar nodos fuera de distribución en grafos textuales, reduciendo FPR95 >7%.

2026-06-02 · 3 min

VocSim: Benchmark sin entrenamiento para identidad de contenido en audio

VocSim evalúa representaciones de audio sin entrenamiento usando Precision@k y GSR. Whisper + PCA logran alto rendimiento, pero falla en lenguas de bajos recursos. Código y leaderboard disponibles.

2026-06-02 · 2 min

Modelado de lenguaje chino con glifos visuales: arranque en caliente

Descubre cómo los glifos visuales duplican la precisión inicial en modelado de lenguaje chino, pero con un límite final.

2026-06-02 · 2 min

Geometría global no basta para visión artificial

Descubre por qué la geometría global no basta para la composición visual y cómo la sensibilidad funcional predice mejor la representación.

2026-06-02 · 2 min

ES-Merging: Fusión de MLLM biológicos mediante señales de embedding

ES-Merging fusiona modelos multimodales biológicos usando señales de embedding, mejorando razonamiento cruzado y preservación.

2026-06-02 · 2 min

Diferencias acústicas y perceptuales en clones de voz estándar y acentuada

El acento afecta la clonación de voz: clones de habla acentuada son menos similares pero más inteligibles. Estudio revela que preservar el acento es clave.

2026-06-02 · 2 min

Gradientes en embeddings semánticos revelan la incertidumbre de los LLM

Descubre cómo los gradientes semánticos revelan la incertidumbre de los LLM. SemGrad y HybridGrad: métodos sin muestreo para predicciones fiables.

2026-06-02 · 2 min

Replay de Lista Estable Canonicalizado para Aprendizaje Federado Privado

CSLR logra entre 3.9 y 5.6 puntos de mejora en aprendizaje continuo federado con privacidad diferencial. Optimiza NLP sin compartir datos.

2026-06-02 · 2 min

Limitaciones teóricas de la predicción de enlaces basada en embeddings

Descubre las limitaciones teóricas de la predicción de enlaces basada en embeddings y cómo las capas no lineales mejoran el rendimiento en grafos densos.

2026-06-02 · 3 min

UR-JEPA: Rectificabilidad Uniforme como Regularizador en JEPA

UR-JEPA logra un 0.83% más de precisión que LeJEPA en Inet10 con menor varianza, y produce representaciones geométricamente distintas.

2026-06-02 · 2 min

Cuando Softmax falla al tope: Correcciones de valor extremo para InfoNCE

Descubre cómo WEINCE corrige el sesgo de softmax en InfoNCE usando teoría de valores extremos para mejorar el aprendizaje contrastivo en visión por computadora.

2026-06-02 · 2 min

SENSE: Decodificación Especulativa con Incrustaciones Semánticas

Descubre SENSE: acelera inferencia de LLMs hasta 3.26x usando embeddings semánticos, sin perder calidad. Ideal para desarrolladores.

2026-06-02 · 2 min

Vinculación de Vectores entre Modelos con Consistencia Isométrica Local

Recupera correspondencias entre nubes de embeddings de distintos modelos usando consistencia geométrica local y hash referencial. Ideal para integración de bases de datos vectoriales.

2026-06-01 · 1 min

PMB: Memoria local-first para Claude, Cursor y Codex - 94.5% recall

Aprende cómo PMB ofrece memoria local persistente para agentes de IA con un sorprendente 94.5% de recall. Sin depender de la nube ni de API keys. ¡Open source!

2026-06-01 · 3 min

Embeddings generalistas vs específicos: ¿cuál es mejor para codificación clínica?

Descubre si los embeddings generalistas o específicos son mejores para la búsqueda de códigos clínicos en varios idiomas. Estudio empírico con datos sintéticos y mejoras en recall.

2026-06-01 · 2 min

PictSure: La calidad de embeddings es clave para el aprendizaje en contexto

PictSure clasifica imágenes con pocos ejemplos usando aprendizaje en contexto. La calidad de los embeddings pre-entrenados es clave. Modelo open source.

2026-06-01 · 2 min

Representaciones hiperesféricas tiempo-frecuencia para detección de anomalías

Aprende cómo las representaciones hiperesféricas tiempo-frecuencia mejoran la detección de anomalías en series temporales. Resultados con k-NN y Mahalanobis.

2026-06-01 · 2 min

Representaciones jerárquicas y composicionales nativas con embeddings de subespacio

Descubre cómo los embeddings como subespacios capturan jerarquías y composición lógica, superando vectores tradicionales en inferencia y negación.

2026-06-01 · 1 min