#ngs · DeepCodeNews

$R^{2k} es teóricamente suficiente para recuperación top-k$

R^{2k} es teóricamente suficiente para recuperación top-k

La investigación demuestra que la dimensión R2k es suficiente para recuperación top-k exacta con embeddings. Resultados sorprendentes en teoría y experimentos.

2026-06-03 · 2 min

Link Prediction o Perdición: Semillas de Inestabilidad en Embeddings

Los modelos de embedding de grafos son fiables? Este estudio revela inestabilidad en predicciones debido a semillas aleatorias. Conoce las limitaciones del MRR.

2026-06-03 · 2 min

Predicción de enlaces o perdición: inestabilidad en embeddings de grafos

Los modelos de embedding (KGEM) generan predicciones inestables en grafos de conocimiento. Las semillas aleatorias y la configuración afectan la fiabilidad. ¿Cómo solucionarlo?

2026-06-03 · 2 min

Capacidad Representacional: Límites Geométricos en Transformers

Descubre cómo la dimensión del modelo establece los límites geométricos para la representación de características en transformers, y cómo estimar la capacidad real de direcciones ortogonales.

2026-06-03 · 2 min

GFFMERGE: Fusión eficiente de campos de fuerza con GNN

Acelera tus simulaciones atomísticas con GFFMERGE, la fusión eficiente de modelos GNN. Logra hasta 27x de velocidad sin reentrenamiento.

2026-06-03 · 3 min

Embeddings de proteínas mejoran generalización en transferencia implícita

Mejora la generalización en dinámica molecular con PLaTITO. Embeddings de proteínas aumentan eficiencia y precisión en muestreo de equilibrio.

2026-06-03 · 2 min

BAT: Transformer de Audio mejorado con Probing Convexo de Compuerta

Conoce BAT, el Transformer de Audio que usa Probing Convexo de Compuerta (CGP) para lograr nuevos récords en benchmarks de audio. ¡Entra!

2026-06-03 · 2 min

NILC: Descubriendo nuevas intenciones con clustering asistido por LLM

NILC usa LLMs para mejorar el clustering en descubrimiento de nuevas intenciones, superando benchmarks en sistemas de diálogo.

2026-06-02 · 2 min

Traducción consciente de densidad de correlaciones espurias en VLMs

Descubre cómo DAT corrige correlaciones espurias en VLMs zero-shot usando densidad local para mejorar precisión sin ajuste fino.

2026-06-02 · 1 min

Rendir más con menos: Muestreo para pérdida por pares

Descubre cómo el muestreo directo de pares reduce costos computacionales en pérdida por pares, manteniendo precisión. Técnicas basadas en teoría de encuestas para IA escalable.

2026-06-02 · 2 min

Clasificación de sonidos ambientales con difusión en espacio de embeddings

Descubre cómo los modelos de difusión superan a métodos previos en clasificación zero-shot de sonidos ambientales, mejorando la generalización a clases no vistas.

2026-06-02 · 2 min

Reconstruir contenido con atención colaborativa mejora embeddings multimodales

Mejora la calidad de embeddings multimodales con atención colaborativa y reconstrucción de contenido para tareas de recuperación y clasificación.

2026-06-02 · 2 min

Topología y texto importan: Detección OOD en grafos con texto usando LLMs

Descubre LG-Plug, un marco plug-and-play que alinea topología y texto para detectar nodos fuera de distribución en grafos textuales, reduciendo FPR95 >7%.

2026-06-02 · 3 min

Similitud de coseno en representaciones de etiquetas: lo que revela y lo que no

La similitud de coseno entre representaciones de etiquetas no revela las probabilidades del modelo. Descubre qué revela sobre clasificadores softmax y sigmoide.

2026-06-02 · 2 min

VocSim: Benchmark sin entrenamiento para identidad de contenido en audio

VocSim evalúa representaciones de audio sin entrenamiento usando Precision@k y GSR. Whisper + PCA logran alto rendimiento, pero falla en lenguas de bajos recursos. Código y leaderboard disponibles.

2026-06-02 · 2 min

Modelado de lenguaje chino con glifos visuales: arranque en caliente

Descubre cómo los glifos visuales duplican la precisión inicial en modelado de lenguaje chino, pero con un límite final.

2026-06-02 · 2 min

Geometría global no basta para visión artificial

Descubre por qué la geometría global no basta para la composición visual y cómo la sensibilidad funcional predice mejor la representación.

2026-06-02 · 2 min

ES-Merging: Fusión de MLLM biológicos mediante señales de embedding

ES-Merging fusiona modelos multimodales biológicos usando señales de embedding, mejorando razonamiento cruzado y preservación.

2026-06-02 · 2 min

Diferencias acústicas y perceptuales en clones de voz estándar y acentuada

El acento afecta la clonación de voz: clones de habla acentuada son menos similares pero más inteligibles. Estudio revela que preservar el acento es clave.

2026-06-02 · 2 min

Gradientes en embeddings semánticos revelan la incertidumbre de los LLM

Descubre cómo los gradientes semánticos revelan la incertidumbre de los LLM. SemGrad y HybridGrad: métodos sin muestreo para predicciones fiables.

2026-06-02 · 2 min