#delos

Olvidar no es borrar: Claves de transporte recuperan conocimiento

El olvido catastrófico no borra conocimiento, solo desalinea interfaces. Descubre cómo claves de transporte recuperan conocimiento latente en IA.

2026-06-03 · 2 min

Epi-LLM: sondeando sesgos conductuales de LLM con modelos epidémicos

Descubre el marco Epi-LLM, que combina modelos de lenguaje y agentes sintéticos para simular comportamientos humanos durante epidemias, comparando con datos rea

2026-06-03 · 2 min

Razonamiento Latente Adaptativo para Agentes

ALAR reduce hasta un 84.6% los tokens en agentes LLM, usando razonamiento latente en rutina y explícito solo cuando es necesario. Eficiencia y precisión mejoradas.

2026-06-03 · 2 min

Guía por recompensa en modelos de flujo y difusión: ¿realmente inclinamos?

El reward hacking en difusión proviene de la estimación finita de la función h. Proponemos una corrección sin costo y aclaramos el best-of-n.

2026-06-03 · 3 min

Cuantificación de incertidumbre escalable en pronóstico de clima extremo con NTK

Mejora la predicción de clima extremo con NTK-UQ: intervalos 31-37% más precisos, adaptativos y sin reentrenamiento.

2026-06-03 · 2 min

Sondas Lineales Detectan el Formato de la Tarea, No el Razonamiento

¿Las sondas lineales detectan razonamiento o formato? Un estudio revela que la precisión en LLMs se explica por confusores de formato, no por modos de razonamie

2026-06-03 · 2 min

Fast-dLLM++: Perfil Fréchet para Inferencia más Rápida de LLM Difusión

Fast-dLLM++ acelera inferencia de LLM difusivos sin modificar modelo, aprovechando confianza heterogénea para lograr 37% más rendimiento sin perder precisión.

2026-06-03 · 2 min

Echelon: Agregados auditables para adaptación de modelos entre fronteras

Descubre cómo Echelon permite adaptar modelos de lenguaje entre organizaciones sin exponer datos, usando solo agregados auditables.

2026-06-03 · 2 min

Preentrenamiento de modelos de lenguaje en textos históricos

Descubre TypewriterLM, un modelo de lenguaje de 7.24B parámetros entrenado con textos anteriores a 1913. Supera desafíos de calidad y fuga temporal.

2026-06-03 · 2 min

Patcher: Reparación post-hoc de modelos de lenguaje con puertas traseras

Descubre cómo Patcher repara modelos de lenguaje con puertas traseras usando solo un fallo reportado. Defensa práctica contra ataques de entrenamiento.

2026-06-03 · 2 min

Cuantización y características interpretables: análisis con autoencoders dispersos

La cuantización no destruye todas las características interpretables: un análisis revela que el 62% persiste en INT6, pero las métricas engañan.

2026-06-03 · 2 min

MUSE: Un arnés agéntico unificado para MLLMs

Potencia MLLMs con MUSE, un arnés agéntico unificado que mejora tareas complejas sin reentrenar, usando verificación y reparación guiada.

2026-06-03 · 3 min

Alucinaciones como ruido ortogonal: alineación de manifold en LLMs

Descubre cómo el nuevo método DCO alinea el manifold semántico en LLMs para reducir alucinaciones, mejorando la fidelidad contextual sin sacrificar conocimiento.

2026-06-03 · 2 min

Inferencia INT8 consciente de picos para modelos de lenguaje spike en CPU

La inferencia INT8 consciente de picos acelera modelos spike en CPU, superando a TinyLlama con 22.63 tokens/s y reduciendo memoria.

2026-06-03 · 2 min

Replanteando representaciones textuales moleculares para LLMs: Estudio empírico

Estudio empírico revela que ninguna representación molecular es universalmente mejor para LLMs. Descubre cuál usar según la tarea química.

2026-06-03 · 2 min

ASymPO: Optimización Asimétrica para Post-Entrenamiento Asíncrono de LLMs

Descubre cómo ASymPO optimiza el post-entrenamiento asíncrono de LLMs sin probabilidades de comportamiento, mejorando estabilidad y rendimiento.

2026-06-03 · 2 min

Optimización eficiente de hiperparámetros para RL en LLMs

Descubre cómo JF-HPO optimiza hiperparámetros en RL para LLMs, logrando hasta 14.9x más eficiencia y mejoras de rendimiento del 5.8% al 111.6%.

2026-06-03 · 1 min

Destilación Constitucional Segura en Política

Descubre cómo COPSD logra un mejor equilibrio entre seguridad y utilidad en modelos de IA, reduciendo el costo de la seguridad en razonamiento general.

2026-06-03 · 2 min

GuidedBridge: Mejora de modelos puente sin entrenamiento con guía previa

Prior Guidance (PG) y FMPG: mejora modelos puente de traducción de imágenes sin entrenamiento, usando guía previa y modulación de frecuencias. Ideal para inpainting.

2026-06-03 · 2 min

Auditoría de Contratos Inteligentes con LLM Ligero vía Destilación y Agregación

Descubre un marco ligero de LLM con destilación y agregación logra un 98.25% de precisión en auditoría de contratos inteligentes, superando modelos grandes.

2026-06-03 · 3 min