#lms · DeepCodeNews

Interacción de modalidades en MLLMs: descomposición parcial

Entiende cómo la PID descompone la interacción entre modalidades en MLLMs, identificando sinergia y redundancia. Clave para mejorar razonamiento y grounding en IA.

2026-06-02 · 2 min

La forma de la sabiduría: Trayectorias de decisión en modelos de lenguaje

Descubre cómo los modelos de lenguaje deciden: la mayoría de respuestas correctas son inestables. Estudio en Qwen, Llama y Mistral.

2026-06-02 · 2 min

CardioLens: Brecha clínica de los MLLMs en resonancia cardíaca

Descubre cómo CardioLens revela la brecha entre el rendimiento en benchmarks y la realidad clínica de los MLLMs en resonancia cardíaca multi-secuencia

2026-06-02 · 2 min

Valencia compartida en LLMs y EEG humano: regularidad de saturación

LLMs y EEG comparten un eje de valencia. La saturación limita la supervisión. Descubre cómo un ensamble mejoró un 10.5% la precisión en FACED.

2026-06-02 · 2 min

StemBind: Cuando la IA sabe la regla pero elige mal

¿Sabías que los modelos multimodales aciertan la regla pero fallan en la respuesta? Descubre StemBind, un benchmark que localiza el verdadero cuello de botella en el razonamiento visual abstracto.

2026-06-02 · 2 min

Comparativa de MLLMs en generación de código para webs interactivas

WebIGBench evalúa MLLMs en generar código de páginas web con interacciones complejas. Descubre los resultados y límites actuales. ¡Lee más!

2026-06-02 · 2 min

DOT-MoE: transporte óptimo diferenciable para modelos MoE

Descubre DOT-MoE, un método que convierte modelos de lenguaje densos en MoE usando transporte óptimo diferenciable, manteniendo un 90% del rendimiento con un 50% menos parámetros activos.

2026-06-02 · 2 min

Alternativa sin entrenamiento: LLMs puntúan procesos matemáticos

Descubre cómo LLMs listos para usar mejoran el razonamiento matemático sin entrenamiento, superando la votación mayoritaria hasta 28%.

2026-06-02 · 1 min

Colapso argumental: LLMs aplanan el debate público

Descubre cómo los LLMs reducen la diversidad de argumentos en debates públicos. Un estudio revela el 'colapso argumental' y sus implicaciones para el discurso social.

2026-06-02 · 3 min

THRD: Defensa sin entrenamiento para ataques multi-turno en LLMs

Descubre THRD, el primer marco sin entrenamiento que detecta ataques multi-turno en LLMs analizando riesgo acumulativo. Reduce éxito de ataques a menos del 4%.

2026-06-02 · 2 min

ProbeScale: Análisis de Sondas para Optimizar Leyes de Escalado en SLMs

Descubre cómo ProbeScale optimiza SLMs mediante análisis de sondas, seleccionando subredes que reducen hasta 10 veces los parámetros sin perder rendimiento.

2026-06-02 · 2 min

Repensando el rol de la temperatura en destilación de LLMs

La temperatura transforma la destilación de LLMs: a altas temperaturas, FKL supera a RKL. Aprende a optimizar la transferencia de conocimiento.

2026-06-02 · 2 min

PlanarBench: Evaluando Razonamiento Espacial de LLMs con Grafos Planos

PlanarBench evalúa la capacidad de los LLMs para dibujar grafos planos en ASCII. Descubre cómo el número de aristas predice el rendimiento de 91 modelos.

2026-06-02 · 2 min

Los LLMs también necesitan codificadores para IDs semánticos

Descubre cómo PrefixMem mejora hasta un 46% la precisión de IDs semánticos en LLMs para recomendación generativa. Optimiza tus modelos.

2026-06-02 · 2 min

Jailbreaking en MLLMs usando video multi-clip

¿Sabías que los modelos de IA multimodales son más vulnerables a ataques con video que con imágenes? Un estudio revela cómo el video multi-clip aumenta el éxito de los jailbreaks.

2026-06-02 · 2 min

Revisitando la edición paramétrica en LLMs: límites teóricos y evidencia

Descubre por qué la edición de parámetros en LLMs daña capacidades clave. Evidencia empírica muestra que la recuperación supera a la edición paramétrica.

2026-06-02 · 2 min

WaveFilter: Filtrado guiado por wavelets para contexto largo en LLMs de difusión

WaveFilter mejora el rendimiento de LLMs de difusión en contexto largo mediante filtrado guiado por wavelets del caché KV.

2026-06-02 · 2 min

Observabilidad para detectar cómputo desperdiciado en LLMs multiagente

Descubre cómo la observabilidad consciente de fallos permite detectar cómputo desperdiciado en sistemas multiagente LLM, ahorrando recursos y mejorando la eficiencia.

2026-06-02 · 3 min

Precisión, estabilidad y fiabilidad de ejecuciones repetidas en LLMs

Los LLMs no siempre son consistentes en programación. Un estudio revela que la precisión puede superar la estabilidad hasta 17.8 puntos. ¡Descubre por qué!

2026-06-02 · 2 min

TriAlign: Logrando Consistencia de Verdad Universal en LLMs

Descubre TriAlign, un framework de aprendizaje multiagente que garantiza la verdad universal en LLMs personalizados reduciendo sesgos entre grupos.

2026-06-02 · 2 min