#salt

SAFE: Verificador de LLM para razonamiento multi-salto con evidencia

Descubre SAFE, un marco que verifica el razonamiento paso a paso en modelos de lenguaje, mejorando la precisión en preguntas complejas multi-salto.

2026-06-10 · 2 min

Desenredando los nudos de GraphRAG: VectorRAG casi es suficiente

Descubre cómo UnWeaver simplifica GraphRAG usando entidades, y por qué VectorRAG compite con el estado del arte a menor costo.

2026-06-09 · 3 min

GNSS-FM: modelo base auto-supervisado para series de desplazamiento GNSS

GNSS-FM: modelo auto-supervisado con 17.000 estaciones. Supera a métodos supervisados en predicción y detección de saltos sísmicos. ¡Descúbrelo!

2026-06-09 · 1 min

GraphER: Enriquecimiento y reranking basado en grafos para RAG

GraphER mejora recuperación multi-fuente en RAG con enriquecimiento y reranking en grafos, sin infraestructura extra. Aumenta completitud de documentos.

2026-06-09 · 2 min

Evaluación de prompting avanzado en Gemini Flash para QA biomédica multi-salto

Evaluamos prompts avanzados en Gemini Flash para QA biomédica. Un prompt complejo logró 0.720, superando al básico (0.565). El diseño de prompts es clave.

2026-06-09 · 2 min

Google Research integra Agentic RAG en Gemini con Agente de Contexto Suficiente

Google Research lanza Agentic RAG con Agente de Contexto Suficiente para búsquedas multi-salto. Aumenta precisión hasta 34% en datos factuales. Preview pública.

2026-06-08 · 4 min

¿Saltar una capa o repetirla? Aprendiendo programas de capas en LLMs

Descubre cómo los LLMs pueden ejecutar programas dinámicos de capas, saltando o repitiendo, para mejorar precisión y eficiencia en razonamiento matemático.

2026-06-08 · 2 min