R^{2k} es teóricamente suficiente para recuperación top-k
La investigación demuestra que la dimensión R2k es suficiente para recuperación top-k exacta con embeddings. Resultados sorprendentes en teoría y experimentos.
La investigación demuestra que la dimensión R2k es suficiente para recuperación top-k exacta con embeddings. Resultados sorprendentes en teoría y experimentos.
Los modelos de embedding de grafos son fiables? Este estudio revela inestabilidad en predicciones debido a semillas aleatorias. Conoce las limitaciones del MRR.
Los modelos de embedding (KGEM) generan predicciones inestables en grafos de conocimiento. Las semillas aleatorias y la configuración afectan la fiabilidad. ¿Cómo solucionarlo?
Descubre cómo la dimensión del modelo establece los límites geométricos para la representación de características en transformers, y cómo estimar la capacidad real de direcciones ortogonales.
Acelera tus simulaciones atomísticas con GFFMERGE, la fusión eficiente de modelos GNN. Logra hasta 27x de velocidad sin reentrenamiento.
Mejora la generalización en dinámica molecular con PLaTITO. Embeddings de proteínas aumentan eficiencia y precisión en muestreo de equilibrio.
Conoce BAT, el Transformer de Audio que usa Probing Convexo de Compuerta (CGP) para lograr nuevos récords en benchmarks de audio. ¡Entra!
NILC usa LLMs para mejorar el clustering en descubrimiento de nuevas intenciones, superando benchmarks en sistemas de diálogo.
Descubre cómo DAT corrige correlaciones espurias en VLMs zero-shot usando densidad local para mejorar precisión sin ajuste fino.
Descubre cómo el muestreo directo de pares reduce costos computacionales en pérdida por pares, manteniendo precisión. Técnicas basadas en teoría de encuestas para IA escalable.
Descubre cómo los modelos de difusión superan a métodos previos en clasificación zero-shot de sonidos ambientales, mejorando la generalización a clases no vistas.
Mejora la calidad de embeddings multimodales con atención colaborativa y reconstrucción de contenido para tareas de recuperación y clasificación.
Descubre LG-Plug, un marco plug-and-play que alinea topología y texto para detectar nodos fuera de distribución en grafos textuales, reduciendo FPR95 >7%.
La similitud de coseno entre representaciones de etiquetas no revela las probabilidades del modelo. Descubre qué revela sobre clasificadores softmax y sigmoide.
VocSim evalúa representaciones de audio sin entrenamiento usando Precision@k y GSR. Whisper + PCA logran alto rendimiento, pero falla en lenguas de bajos recursos. Código y leaderboard disponibles.
Descubre cómo los glifos visuales duplican la precisión inicial en modelado de lenguaje chino, pero con un límite final.
Descubre por qué la geometría global no basta para la composición visual y cómo la sensibilidad funcional predice mejor la representación.
ES-Merging fusiona modelos multimodales biológicos usando señales de embedding, mejorando razonamiento cruzado y preservación.
El acento afecta la clonación de voz: clones de habla acentuada son menos similares pero más inteligibles. Estudio revela que preservar el acento es clave.
Descubre cómo los gradientes semánticos revelan la incertidumbre de los LLM. SemGrad y HybridGrad: métodos sin muestreo para predicciones fiables.