#lms · DeepCodeNews

SEFT: Ajuste fino disperso para LLMs con evolución de la dispersión

Descubre SEFT, un método de ajuste fino que permite a los LLMs dispersos evolucionar su estructura manteniendo eficiencia. Supera a métodos existentes.

2026-06-03 · 2 min

PieArena: Ranking y Perfil de Agentes de Lenguaje en Negociaciones Realistas

PieArena mide la capacidad de negociación de los LLMs en escenarios reales. GPT-5 iguala o supera a humanos en este benchmark.

2026-06-03 · 2 min

Evaluación del razonamiento relacional en LLMs con REL

Descubre cómo el benchmark REL evalúa el razonamiento relacional en LLMs, revelando sus limitaciones en tareas de alta aridad en ciencias.

2026-06-03 · 2 min

Optimización automatizada con agentes en coevolución y razonamiento interpretable

Descubre cómo EvoOR-Agent utiliza la coevolución de arquitecturas de agentes y razonamiento interpretable para optimizar procesos complejos con LLMs. Mejora el rendimiento y la interpretabilidad.

2026-06-03 · 2 min

Align-KD: destilando conocimiento de alineación multimodal para VLMs móviles

Descubre Align-KD, técnica que destila conocimiento de alineación multimodal de VLMs grandes a modelos móviles, mejorando precisión en 6 benchmarks.

2026-06-03 · 2 min

Por qué los LLMs reescriben la historia y cómo restaurarla

Los LLMs tienden a modernizar textos históricos. Descubre cómo el marco HAV con sistemas multiagente restaura la precisión documental. Lee más.

2026-06-03 · 2 min

SeSE: Cuantificación de incertidumbre en LLMs basada en teoría estructural

Aprende cómo SeSE cuantifica la incertidumbre en LLMs usando teoría estructural para evitar alucinaciones. Mejora la fiabilidad de tus modelos.

2026-06-03 · 2 min

La linealidad relacional predice alucinaciones en LLMs

Descubre cómo la linealidad relacional en modelos de lenguaje predice alucinaciones. Un nuevo estudio revela claves para entender fallos en IA.

2026-06-03 · 1 min

Optimización en tiempo de prueba de planes de consulta física con LLMs

Descubre cómo los LLMs optimizan planes de consulta física en tiempo de prueba, logrando aceleraciones de hasta 4.78x en consultas OLAP. ¡Aumenta la eficiencia!

2026-06-03 · 3 min

Agentes para LLMs: Arquitectura, Adquisición, Seguridad y Futuro

Habilidades modulares para LLMs: arquitectura, adquisición y seguridad. 26% de habilidades tienen vulnerabilidades. Marco de confianza propuesto. ¡Futuro de agentes!

2026-06-03 · 2 min

KnapSpec: Decodificación Especulativa con Selección Adaptativa de Capas

KnapSpec acelera inferencia LLMs hasta 1.47x sin entrenamiento. Selecciona capas adaptativas como problema mochila. Optimiza rendimiento en secuencias.

2026-06-03 · 2 min

DECA: Descentralizando el Ajuste Fino Completo de LLMs

Descubre DECA, el ajuste fino completo descentralizado para LLMs con Adam por bloques y datos no IID.

2026-06-03 · 1 min

Denoise primero, ortogonaliza después: Momento en Muon como filtro espectral

Descubre cómo el momento en Muon filtra el ruido del gradiente, mejorando el entrenamiento de LLMs. Un análisis teórico con respaldo experimental.

2026-06-03 · 3 min

Adversarial ML para LLMs: ¿sin avance real?

El Adversarial ML para LLMs no progresa: problemas vagos, complejos y difíciles de medir. Conoce las razones y el riesgo de una década perdida.

2026-06-03 · 1 min

MuLoCo: Muon como optimizador interno práctico para DiLoCo

Descubre MuLoCo, el optimizador con Muon que supera a DiLoCo, permite mayores batch sizes y mejor escalabilidad en entrenamiento de modelos de lenguaje.

2026-06-03 · 2 min