#delos

Actualizar el arnés no es beneficio: evolución en agentes LLM auto-evolutivos

Descubre por qué actualizar el arnés de agentes LLM no siempre mejora su rendimiento. Los modelos intermedios son los que más se benefician.

2026-06-03 · 3 min

Reglas tipo grafo para razonamiento en KGs con modelos de difusión

Descubre cómo GRiD usa modelos de difusión y aprendizaje por refuerzo para generar reglas tipo grafo, mejorando el razonamiento en grafos de conocimiento con resultados competitivos.

2026-06-03 · 2 min

SLAT: Recorte Adaptativo de Segmentos en Razonamiento CoT

SLAT: recorte adaptativo por segmentos reduce un 50% la longitud del razonamiento CoT sin perder precisión.

2026-06-03 · 1 min

Destilación de feedback de LLM para demostración de teoremas en Lean

Aprende sobre Feedback Distillation, un método que mejora la demostración de teoremas en Lean4 superando al GRPO. Incrementa diversidad y eficiencia en el entrenamiento de modelos de razonamiento.

2026-06-03 · 2 min

UniScale: Optimización Unificada de Inferencia Adaptativa

UniScale unifica ruteo de modelos y escalado en prueba para optimizar calidad-coste en LLMs. Aprende cómo se adapta dinámicamente a cada solicitud.

2026-06-03 · 2 min

Personas sintéticas para evaluar la alineación pluralista en IA

Las personas sintéticas permiten evaluar la alineación pluralista en IA generativa, superando benchmarks únicos y revelando la necesidad de mecanismos dinámicos.

2026-06-03 · 2 min

Poda de redes neuronales post-entrenamiento con curvatura de grafos

Descubre cómo la curvatura de grafos permite podar redes neuronales sin perder precisión. Técnica innovadora basada en Ollivier-Ricci para identificar conexiones clave.

2026-06-03 · 2 min

De diagnóstico interno a auditoría externa: defensa contra backdoors con VLM

Conoce PRISM, un marco basado en VLMs que cambia el diagnóstico interno por auditoría externa para neutralizar backdoors con tasa de éxito menor al 1%.

2026-06-03 · 2 min

Cuantificando la incertidumbre de modelos fundacionales con SVE

Descubre SVE: incertidumbre calibrada en modelos fundacionales con solo 1% de parámetros extra.

2026-06-03 · 2 min

Float8@2bits: compresión de modelos sin datos vía codificación de entropía

EntQuant comprime modelos de 70B parámetros en solo 10 minutos sin datos de calibración, alcanzando SOTA en compresión extrema a 2 bits con codificación de entropía.

2026-06-03 · 1 min

dgMARK: Marcado de Agua Guiado por Decodificación para Modelos de Lenguaje de Difusión

Descubre dgMARK: el nuevo marcado de agua guiado por decodificación para modelos de difusión. Protege tu IA fácilmente.

2026-06-03 · 3 min

SALAAD: Adaptación dispersa y de bajo rango con ADMM para inferencia de LLM

Descubre cómo SALAAD reduce el consumo de memoria en modelos de lenguaje grandes usando estructuras dispersas y de bajo rango, permitiendo un despliegue flexible sin reentrenamiento.

2026-06-03 · 3 min

Adaptadores Kronecker: la importancia del diseño de componentes

Optimiza el ajuste fino de modelos grandes con adaptadores Kronecker. Conoce CDKA, una nueva técnica que mejora la capacidad y eficiencia mediante el diseño estratégico de componentes.

2026-06-03 · 2 min

FlexRank: Descomposición Anidada de Bajo Rango para Despliegue Adaptativo

FlexRank extrae submodelos de capacidad variable de modelos sin reentrenar. Optimiza costos y rendimiento para despliegue adaptativo a todo presupuesto.

2026-06-03 · 1 min

Evaluación Causal de Ataques de Inferencia de Membresía

Descubre un nuevo enfoque causal para evaluar ataques de inferencia de membresía sin reentrenar, reduciendo sesgos. ¡Ideal para LLMs!

2026-06-03 · 2 min

La ilusión de generalización en modelos de lenguaje tabulares

¿Son realmente efectivos los modelos de lenguaje tabulares? Nuestra reevaluación de Tabula-8B muestra que la generalización se debe a artefactos de evaluación, no a aprendizaje real.

2026-06-03 · 2 min

Compresión extremo a extremo para modelos tabulares

Descubre cómo TACO comprime datasets tabulares en espacio latente, logrando hasta 94x más rapidez y 97% menos memoria sin perder rendimiento.

2026-06-03 · 2 min

El sesgo de inducción en modelos secuenciales

Investigación muestra que los transformers requieren más datos que las RNN para seguimiento de estado y no comparten pesos entre longitudes. Descubre las diferencias clave.

2026-06-03 · 2 min

HiPPO Zoo: Memoria Explícita para Modelos de Estado Interpretables

Descubre cómo las extensiones del framework HiPPO ofrecen memoria adaptativa y asociativa en modelos de espacio de estado, manteniendo la interpretabilidad. Un

2026-06-03 · 2 min

Descubrimiento progresivo de leyes físicas basado en datos

CoSR descubre progresivamente leyes físicas desde datos, imitando el método científico. Aplicaciones en turbulencia, flujos y aerodinámica.

2026-06-03 · 2 min