#lms · DeepCodeNews

AuRA: Internalizando la Comprensión de Audio en LLMs como LoRA

Descubre AuRA: integra comprensión de audio en LLMs mediante LoRA para modelado conjunto y eficiente inferencia paralela. Supera a sistemas en cascada.

2026-06-10 · 2 min

Personalidades múltiples y cambio dinámico en modelos de visión-lenguaje

Explora cómo los modelos de visión-lenguaje componen y cambian personalidades múltiples dinámicamente, afectando el razonamiento y la descripción de imágenes.

2026-06-10 · 2 min

Personalidades múltiples en modelos de visión-lenguaje: conmutación dinámica

Modelos de visión-lenguaje con múltiples personalidades: ¿cómo afecta al rendimiento? Conoce los hallazgos sobre equilibrio y residuales.

2026-06-10 · 2 min

GASLoC: unificando comunicaciones y actualizaciones locales para LLMs

GASLoC unifica comunicaciones y actualizaciones locales para preentrenar LLMs de forma eficiente, superando a DiLoCo en entornos heterogéneos.

2026-06-10 · 3 min

¿Cómo fluye el razonamiento? Rastreo del flujo de información para RL en LLMs

Descubre cómo FlowTracer rastrea el flujo de razonamiento en modelos de lenguaje para asignar crédito preciso a los tokens clave y mejorar el aprendizaje por refuerzo.

2026-06-10 · 2 min

Priores estructurales no paramétricos para predicción de teoremas geométricos

Descubre cómo los priores estructurales no paramétricos y los grafos de precedencia permiten a los LLMs predecir teoremas geométricos con un 89.29% de precisión, superando modelos supervisados.

2026-06-10 · 2 min

Conditional Vendi Score: Evaluación de diversidad en IA generativa

Descubre el Conditional Vendi Score, una nueva métrica que aísla la diversidad generada por el modelo en sistemas de IA guiados por prompts. Ideal para evaluar LLMs y modelos texto-imagen.

2026-06-10 · 2 min

GRID: Escalando inferencia sin tareas en ajuste continuo de prompts

Descubre GRID, un nuevo marco para el aprendizaje continuo en LLMs que evita la dependencia de identificadores de tarea, mejorando la transferencia hacia atrás y reduciendo el uso de memoria.

2026-06-10 · 3 min

TruthRL: Aprendizaje por refuerzo para LLMs veraces

Descubre TruthRL, un marco de RL que reduce alucinaciones en LLMs al incentivar respuestas correctas y abstención. Mejora la veracidad hasta un 37%.

2026-06-10 · 3 min

MedFeat: ingeniería de características con LLMs para predicción clínica

Descubre cómo MedFeat usa LLMs para ingeniería de características consciente del modelo, mejorando predicciones clínicas en más de un 10%.

2026-06-10 · 2 min

IDP-Bench: Evaluando la privacidad interdependiente en modelos de lenguaje

¿Pueden los LLMs proteger tu privacidad cuando otros comparten tus datos? IDP-Bench lo mide.

2026-06-10 · 2 min

Guía Residual Anclada: Nueva Técnica de Destilación en IA

Descubre cómo la Guía Residual Anclada mejora la destilación privilegiada en modelos de lenguaje, reduciendo sesgos y potenciando el razonamiento complejo.

2026-06-10 · 3 min

Moderación en streaming de LLMs con sondas de estado oculto

Las sondas de estado oculto permiten moderar LLMs en streaming sin costo adicional. Detén contenido inseguro token a token, reduce latencia y ahorra recursos. Guía práctica.

2026-06-10 · 3 min

POET-X: Entrenamiento eficiente de LLMs con transformaciones ortogonales

Descubre POET-X, el método que entrena LLMs de miles de millones de parámetros en una sola GPU H100 con menor memoria. ¡Optimiza tu entrenamiento!

2026-06-09 · 1 min

Reduciendo costos de evaluación de LLMs con SySRs

Descubre cómo SySRs reduce costos al evaluar LLMs, aprovechando la similitud entre modelos para identificar el mejor sin desperdiciar recursos.

2026-06-09 · 1 min

ConSteer-RL: Dirigiendo el razonamiento en LLMs con RL consciente de la confianza

Descubre ConSteer-RL: un nuevo método que mejora el razonamiento de LLMs usando señales de confianza con RL. Resultados: hasta 4% de mejora.

2026-06-09 · 2 min

ConSteer-RL: Dirigiendo razonamiento en LLMs con RL consciente de confianza

Descubre cómo ConSteer-RL mejora el razonamiento de LLMs usando señales de confianza, logrando mejoras del 2.3% al 4%.

2026-06-09 · 2 min

Control no lineal de activaciones mediante transformaciones latentes invertibles

Descubre INNSteer: control no lineal de LLMs con transformaciones latentes invertibles que mejora precisión y fluidez sin comprometer la inferencia.

2026-06-09 · 2 min

Claw-R1: Middleware de datos paso a paso para RL agentivo

Descubre Claw-R1, el middleware que transforma las interacciones agente-entorno en datos gestionables para mejorar el RL agentivo. Optimiza el entrenamiento de LLMs con datos paso a paso.

2026-06-09 · 1 min

BUDDY: Enrutamiento Dinámico Basado en Presupuesto para Inferencia de LLMs

Descubre cómo BUDDY reduce costes en inferencia de LLMs mediante enrutamiento dinámico por presupuesto, adaptándose al contexto en tiempo real.

2026-06-09 · 1 min