#delos

Alucinaciones sintéticas, ganancias reales en modelos de código

Genera ejemplos sintéticos sin ejecución para mitigar alucinaciones en autocompletado. +18.8 EM en Delulu.

2026-06-03 · 2 min

HARVE: Edición Robusta del Vector de Cabeza de Recompensa

Descubre HARVE, método sin entrenamiento que edita el vector de cabeza de recompensa para proteger modelos de lenguaje del hackeo, manteniendo su rendimiento.

2026-06-03 · 2 min

Alucinaciones sintéticas, ganancias reales: negativos duros para mitigar FIM

Descubre cómo los modelos frontera generan alucinaciones sintéticas como negativos duros para entrenar modelos de código y reducir alucinaciones +18.8%.

2026-06-03 · 2 min

HARVE: Edición de Vector de Recompensa para Robustez ante Hacking

Descubre HARVE, un método sin entrenamiento que edita el vector de recompensa para eliminar el reward hacking en modelos de lenguaje. Mejora robustez sin perder capacidad.

2026-06-03 · 2 min

DECA: Ajuste Fino Completo Descentralizado de LLMs en Datos No IID

Descubre DECA: ajuste fino completo descentralizado de LLMs en datos no IID. Eficiente y rápido. ¡Infórmate!

2026-06-03 · 2 min

Alinear estados ocultos verificados mejora razonamiento en RL

Hidden-Align alinea estados ocultos verificados para mejorar el razonamiento en RL, logrando hasta 6.2 puntos de mejora en benchmarks.

2026-06-03 · 2 min

El acierto hace la fuerza: alinear estados ocultos para RL

Hidden-Align alinea estados ocultos en modelos de lenguaje, mejorando el razonamiento matemático hasta un 6.2% en benchmarks. Técnica innovadora de RL.

2026-06-03 · 2 min

Gobernanza multiagente para adaptación online de modelos termohidráulicos

Un sistema multiagente con validación por compuertas reduce un 19% el error en predicciones termohidráulicas bajo cambios de régimen operativo. Descubre cómo.

2026-06-03 · 3 min

Validación y gobernanza multiagente para adaptación de modelos termohidráulicos

Descubre cómo un sistema multiagente con validación mejora un 19% la precisión de los modelos termohidráulicos, reduciendo errores en pronósticos dinámicos.

2026-06-03 · 2 min

APIC: Calibración Amortiguada Informada por Física con Procesos Neuronales

APIC permite calibración rápida de modelos físicos con procesos neuronales. Cuantifica incertidumbre y mejora la precisión a partir de datos escasos.

2026-06-03 · 1 min

APIC: Calibración amortizada basada en física con procesos neuronales

Descubre APIC: calibración amortizada con procesos neuronales para modelos físicos. Reduce errores y cuantifica incertidumbre con datos escasos.

2026-06-03 · 2 min

GEAR: Mitigando la propagación de crédito falso en RL con rubricas

GEAR mitiga la propagación de crédito falso en RL con rubricas, logrando mejoras del 15.5% y reduciendo errores un 96.5%. Conoce cómo.

2026-06-03 · 3 min

Link Prediction o Perdición: Semillas de Inestabilidad en Embeddings

Los modelos de embedding de grafos son fiables? Este estudio revela inestabilidad en predicciones debido a semillas aleatorias. Conoce las limitaciones del MRR.

2026-06-03 · 2 min

Mitigación del Crédito Falso en RL con Rúbricas

GEAR soluciona la propagación de crédito falso en RL con rúbricas mediante agregación gráfica probabilística. Logra mejoras de hasta 15.5% en HealthBench, WritingBench y PLawBench.

2026-06-03 · 2 min

Predicción de enlaces o perdición: inestabilidad en embeddings de grafos

Los modelos de embedding (KGEM) generan predicciones inestables en grafos de conocimiento. Las semillas aleatorias y la configuración afectan la fiabilidad. ¿Cómo solucionarlo?

2026-06-03 · 2 min

Flicker-DDPM: Acelerando la difusión con ruido coloreado 1/f

Descubre Flicker-DDPM, un nuevo modelo de difusión que acelera el muestreo hasta 3.33 veces usando ruido coloreado 1/f, mejorando la calidad de generación.

2026-06-03 · 1 min

Flicker-DDPM: Acelerando la difusión de denoising con ruido coloreado 1/f

Descubre cómo Flicker-DDPM acelera la generación de imágenes con ruido coloreado 1/f, reduciendo pasos de muestreo hasta 3 veces sin pérdida de calidad.

2026-06-03 · 2 min

KVarN: Cuantificación de caché KV con normalización de varianza

Reduce errores en razonamiento con KVarN. Cuantificación KV de 2 bits que optimiza la memoria y mejora el rendimiento en modelos de lenguaje.

2026-06-03 · 2 min

Desmitificando el paralelismo de pipelines: teoría para PipeDream

Descubre cómo PipeDream logra convergencia en entrenamiento distribuido con un nuevo análisis teórico no convexo. Comparativa con LocalSGD.

2026-06-03 · 2 min

Speedrun de preentrenamiento de modelos tabulares

Descubre cómo el speedrun de nanoTabPFN logró un speedup de 81x en preentrenamiento de modelos tabulares. Participa y contribuye al benchmark abierto en GitHub.

2026-06-03 · 3 min