#cadena

DDOR: Pruebas y Reparación del Sobrerrechazo en LLMs

Descubre DDOR, un marco automatizado para detectar y reparar el sobrerrechazo en LLMs, mejorando su usabilidad sin sacrificar la seguridad. Explicabilidad y pruebas escalables.

2026-06-03 · 3 min

Taiji: Optimización Pareto para Recomendación Industrial con LLM

Descubre cómo Taiji optimiza recomendaciones industriales con LLM, equilibrando semántica e IDs de usuario. Resultados reales en Kuaishou.

2026-06-03 · 2 min

q0: Primitivas para el preentrenamiento con hiper-épocas

Descubre q0: primitivas para preentrenar con hiper-épocas. Genera una población de modelos diversos que logran menor pérdida de validación con hasta 4.6x menos épocas.

2026-06-03 · 3 min

Expresión fiel de confianza en modelos de razonamiento grandes

¿Los modelos de razonamiento grandes expresan su confianza de forma fiel? Cuantificamos la calibración entre incertidumbre interna y verbalizada, revelando desa

2026-06-03 · 3 min

DTKG: Razonamiento dual con grafos de conocimiento para QA multi-salto

Descubre DTKG, un marco que combina verificación de hechos y cadenas en grafos de conocimiento para responder preguntas multi-salto con alta precisión.

2026-06-03 · 3 min

Mercados tokenizados: protecciones, no guardianes

Los mercados tokenizados necesitan protecciones en cadena, no guardianes centralizados. Descubre cómo lograr adopción masiva sin sacrificar la descentralización.

2026-06-03 · 2 min

Pi Agent con Gemini Enterprise: Sistema de Acción Autónomo para Cadena de Suministro

Pi Agent con Gemini Enterprise automatiza tu cadena de suministro: planificación autónoma en 60 segundos. Alinea ventas, finanzas y operaciones sin reuniones. Solicita demo.

2026-06-03 · 2 min

Backlog de la NVD: síntoma del problema de escala en ciberseguridad

El backlog de la NVD supera 27,000 vulnerabilidades sin procesar. Descubre cómo adaptar la gestión de vulnerabilidades a un ritmo insostenible.

2026-06-03 · 2 min

LatentChem: Del CoT textual al pensamiento latente en razonamiento químico

LatentChem: razonamiento químico con pensamiento latente. Logra 59.88% de victorias frente a CoT y 10x menos pasos. Optimización sin cadenas textuales.

2026-06-03 · 1 min

Autointerpretación: adaptadores ligeros entrenados en pares vector-etiqueta

Cómo adaptadores ligeros entrenados en pares vector-etiqueta logran autointerpretación que supera etiquetas y revela razonamiento implícito.

2026-06-03 · 2 min

Midiendo la legibilidad débil-a-fuerte en modelos de razonamiento

Evalúa la legibilidad débil-a-fuerte en modelos de razonamiento: cadenas de pensamiento claras para supervisión segura de IA.

2026-06-03 · 2 min

FGRPO: Aprendizaje Federado con Agregación Adaptativa en Datos No IID

FGRPO: fine-tuning privado de modelos de lenguaje con agregación adaptativa en datos no IID. Mejora el razonamiento sin exponer datos.

2026-06-03 · 2 min

Teoría asintótica de Chain of Thought en aprendizaje en contexto

Descubre cómo la profundidad del razonamiento en cadena afecta la generalización en modelos de lenguaje. Teoría asintótica y fases de mejora exponencial.

2026-06-03 · 2 min

Heterogeneidad cognitiva y sesgos en cadenas de suministro con LLM

La heterogeneidad cognitiva en LLM (DeepSeek, GPT) afecta cadenas de suministro. La simulación revela sesgos y cómo compartir información mitiga ineficiencias.

2026-06-03 · 2 min

Razonamiento Latente Adaptativo para Agentes

ALAR reduce hasta un 84.6% los tokens en agentes LLM, usando razonamiento latente en rutina y explícito solo cuando es necesario. Eficiencia y precisión mejoradas.

2026-06-03 · 2 min