#lms · DeepCodeNews

TinyJudge: alineación de restricciones no verificables con conjuntos ligeros

TinyJudge alinea modelos de lenguaje con restricciones no verificables usando conjuntos ligeros de especialistas. Logra un 10% de rendimiento y 3x velocidad.

2026-06-09 · 2 min

LLMs extraen consenso científico en superconductividad

Descubre cómo los LLMs logran extraer el consenso científico en un campo complejo como la superconductividad de alta temperatura. Un estudio revelador.

2026-06-09 · 3 min

Mitigación de alucinaciones en LVLMs con control de sensibilidad visual por token

Descubre TLVS, un método de control de sensibilidad visual por token que reduce alucinaciones en modelos de visión-lenguaje sin afectar contenido veraz.

2026-06-09 · 1 min

Hacia la generación automática de kernels con LLMs

Descubre cómo los LLMs y agentes inteligentes automatizan la generación y optimización de kernels GPU, superando limitaciones humanas. Revisión exhaustiva de métodos, datasets y desafíos futuros.

2026-06-09 · 2 min

Evaluación no paramétrica de LLM a partir de preferencias

Descubre DMLRank: evaluación no paramétrica de LLMs con datos de preferencia. Ranking robusto con incertidumbre cuantificada.

2026-06-09 · 2 min

Transición de fase en LLMs y criticalidad del lenguaje natural

Descubre cómo los LLMs muestran una transición de fase al variar la temperatura, generando textos con patrones de ley de potencia como el lenguaje natural.

2026-06-09 · 1 min

Escalamiento eficiente de LLMs con paralelismo de contexto flexible

Acelera el entrenamiento de LLMs con paralelismo de contexto flexible. Logra hasta 2.24x de velocidad incluso con datos heterogéneos.

2026-06-09 · 2 min

Tensorizando Engram: Latentes compartidos en N-gramas para LLMs

Descubre TN-gram: un módulo de memoria compacto que mejora LLMs al compartir factores latentes entre embeddings de N-gramas con menos parámetros.

2026-06-09 · 2 min

Ahora me ves: Detectando esteganografía evasiva en LLMs

Los LLMs pueden ocultar secretos mediante esteganografía. La detección con sondas lineales se evade, pero se restaura con recontextualización.

2026-06-09 · 2 min

Ejecutar dos LLMs en una Mini PC suena genial hasta que llegan los benchmarks

Ejecutar dos LLMs en una Mini PC suena bien, pero los benchmarks revelan un cuello de botella de memoria que lo hace contraproducente.

2026-06-09 · 2 min

La nueva orden de IA de Trump: las alucinaciones no son solo para LLMs

El decreto de Trump sobre IA promete seguridad, pero ¿es solo un gesto vacío? Analizamos sus deficiencias y la realidad.

2026-06-09 · 1 min

Transformaciones geométricas de la verdad en LLMs según el contexto

Estudio revela cómo el contexto modifica geométricamente las representaciones de verdad en LLMs. Cambios direccionales y de magnitud separan verdad de falsedad.

2026-06-09 · 1 min

DyCP: Podado Dinámico de Contexto para Diálogos Extensos con LLMs

DyCP poda dinámicamente el contexto en diálogos extensos con LLMs, reduciendo costes de inferencia sin perder precisión. Optimiza tus modelos.

2026-06-09 · 1 min

ReD: mejora la inferencia de LLMs con presupuesto fijo

Descubre cómo ReD (Reset and Discard) mejora la inferencia de LLMs a presupuesto fijo, aumentando la cobertura de respuestas correctas y reduciendo costos en tokens y USD.

2026-06-09 · 2 min

¿Pueden los MLLMs auto-recuperar contenido visual corrupto?

Descubre cómo Robust-U1 permite a los MLLMs auto-recuperar imágenes corruptas, mejorando la comprensión visual con aprendizaje por refuerzo y alcanzando resultados líderes.

2026-06-09 · 2 min

GlobeAudio: benchmark multilingüe para modelos de audio-lenguaje

Descubre GlobeAudio, el primer benchmark multilingüe y multicultural para evaluar modelos de audio-lenguaje en condiciones realistas. Resultados sorprendentes.

2026-06-09 · 1 min

Auditoría de alineación propietaria en LLMs

Descubre cómo detectar alineación propietaria en modelos de lenguaje sin un estándar de referencia. Un marco comparativo para auditar sesgos y políticas ocultas.

2026-06-09 · 1 min

Más charla, menos significado: Automejora en SLMs

¿Los modelos de lenguaje pequeños realmente aprenden de sus errores? Un estudio revela que solo mejoran un 4.4% y que más razonamiento puede empeorarlos.

2026-06-09 · 2 min

EinSort: Solo ordenar para tensorizar LLMs

EinSort: ordenando índices para tensorizar LLMs. Descubre estructuras de rango bajo y comprime pesos y KV-cache con mejor calidad. ¡Optimiza tus modelos!

2026-06-09 · 3 min

Aprendizaje Jerárquico Alineado a Capacidades para LLMs con Herramientas

Aprende cómo CAHL alinea planificador y ejecutor en LLMs con herramientas, mejorando el rendimiento en tareas complejas.

2026-06-09 · 2 min