#lms · DeepCodeNews

AdaptiveK: Autoencoders Dispersos por Complejidad

AdaptiveK ajusta dinámicamente la esparcidad según la complejidad semántica, mejorando interpretabilidad y reconstrucción de modelos de lenguaje.

2026-06-02 · 2 min

Seguridad en LLMs caja negra: Alineación mediante optimización restringida

Alinea LLMs de caja negra en inferencia usando optimización restringida y teoría de juegos para balancear seguridad y utilidad.

2026-06-02 · 2 min

FIRM: Alineación multiobjetivo regularizada en cliente federada

FIRM alinea LLMs con múltiples objetivos eficientemente y en privado usando aprendizaje federado. Mejora equilibrio entre utilidad e inocuidad.

2026-06-02 · 2 min

Quartet II: Pre-entrenamiento de LLMs en NVFP4

Descubre Quartet II, el método que optimiza el pre-entrenamiento de LLMs en formato NVFP4 en GPUs Blackwell. Mayor precisión y velocidad en tus modelos.

2026-06-02 · 2 min

DAPD: Decodificación Paralela con Atención y Dependencias para LLMs de Difusión

Descubre cómo DAPD mejora la precisión y velocidad en LLMs de difusión mediante decodificación paralela consciente de dependencias sin reentrenamiento.

2026-06-02 · 2 min

Descubriendo brechas de competencia en LLMs y sus benchmarks

Un método innovador con autoencoders revela brechas ocultas en LLMs y benchmarks. Mejora la evaluación de modelos de IA identificando conceptos débiles.

2026-06-02 · 2 min

Datos sintéticos de calidad permiten primeras leyes de escalado para LLMs en recomendación

Descubre cómo datos sintéticos de calidad permiten las primeras leyes de escalado para LLMs en recomendación, superando datos reales.

2026-06-02 · 1 min

Misma carga, distinto canal: la asimetría de seguridad en LLMs

Descubre cómo los LLMs reaccionan distinto ante contenido malicioso según si llega por usuario, metadatos o salidas de herramientas. Un estudio revela una asimetría de confianza.

2026-06-02 · 4 min

LLMs y Alzheimer: Fine-tuning y probing para detección temprana

Descubre cómo los LLMs como BERT, T5 y Llama se adaptan para detectar Alzheimer mediante fine-tuning y probing, logrando nuevos récords en datasets clínicos.

2026-06-02 · 1 min

Autoresearch descubre ataques adversariales avanzados para LLMs

Descubre cómo la IA logra encontrar nuevos métodos de ataque adversarial contra LLMs, superando defensas avanzadas con tasas de éxito del 80% y 100%.

2026-06-02 · 2 min

SCOPE: Calibración de Señales en Destilación On-Policy Dual

Descubre cómo SCOPE mejora el razonamiento de los LLMs con destilación adaptativa dual, logrando un 11.42% más de precisión.

2026-06-02 · 4 min

DREAM-S: Decodificación especulativa para generación multimodal

Acelera la generación multimodal con DREAM-S, un novedoso método de decodificación especulativa que alcanza 3.85x de velocidad en VLMs.

2026-06-02 · 2 min

Construí un llms.txt para Salesforce: la IA deja de escribir Apex obsoleto

Descubre cómo un archivo llms.txt evita que la IA genere Apex obsoleto en Salesforce. Pruebas con Opus, Sonnet y ChatGPT muestran la diferencia.

2026-06-02 · 3 min

SimSD: Decodificación especulativa simple en modelos de lenguaje de difusión

Descubre SimSD: un método de decodificación especulativa para modelos de difusión que acelera la inferencia hasta 7.46x sin sacrificar calidad.

2026-06-02 · 2 min

LLMs discriminan estados clave para exploración multiagente eficiente

Descubre cómo LEMAE usa LLMs para identificar estados clave y acelerar la exploración multiagente, con menos redundancia. Resultados superiores en SMAC y MPE.

2026-06-02 · 2 min

Evaluación del razonamiento interactivo en LLMs: benchmark jerárquico con juegos

Descubre cómo un nuevo benchmark evalúa el razonamiento interactivo de los LLMs mediante juegos ejecutables, midiendo éxito, eficiencia y adaptación metacognitiva.

2026-06-02 · 2 min

Interacción de modalidades en MLLMs: descomposición parcial

Entiende cómo la PID descompone la interacción entre modalidades en MLLMs, identificando sinergia y redundancia. Clave para mejorar razonamiento y grounding en IA.

2026-06-02 · 2 min

La forma de la sabiduría: Trayectorias de decisión en modelos de lenguaje

Descubre cómo los modelos de lenguaje deciden: la mayoría de respuestas correctas son inestables. Estudio en Qwen, Llama y Mistral.

2026-06-02 · 2 min

CardioLens: Brecha clínica de los MLLMs en resonancia cardíaca

Descubre cómo CardioLens revela la brecha entre el rendimiento en benchmarks y la realidad clínica de los MLLMs en resonancia cardíaca multi-secuencia

2026-06-02 · 2 min

Valencia compartida en LLMs y EEG humano: regularidad de saturación

LLMs y EEG comparten un eje de valencia. La saturación limita la supervisión. Descubre cómo un ensamble mejoró un 10.5% la precisión en FACED.

2026-06-02 · 2 min