#grandes

CRMA: Backbone con límite espectral para ajuste fino continuo de LLMs

Descubre CRMA: ajuste fino secuencial de LLMs sin olvido catastrófico, mejorando rendimiento en tareas previas. Sin buffers, sin destilación.

2026-06-02 · 2 min

ODTQA-FoRe: dataset para preguntas tabulares y pronóstico

Descubre ODTQA-FoRe, el primer dataset para preguntas tabulares con predicción futura. TimeFore combina LLM y modelos de series temporales para pronósticos precisos en datos inmobiliarios.

2026-06-02 · 2 min

ACON: Compresión de contexto óptima para agentes LLM de larga duración

Descubre cómo ACON comprime el contexto de agentes LLM sin reentrenar, reduciendo tokens hasta un 54% y mejorando el éxito en tareas largas. ¡Optimiza tu IA!

2026-06-02 · 2 min

Agregación de Deltas de Preferencia: de señales débiles a modelos fuertes

Aprende cómo el método PDA agrega señales débiles con fusión LoRA para mejorar LLMs en razonamiento y búsqueda.

2026-06-02 · 2 min

CoEvo-AHD: Heurísticas Evolutivas con LLM para Optimización Acoplada

Descubre cómo CoEvo-AHD usa LLMs para co-evolucionar heurísticas en problemas de optimización acoplada como TTP y TPP, mejorando soluciones de forma automática.

2026-06-02 · 2 min

Intervención relacional en colapso funcional de LLMs

Investigación con Qwen3.5-4B: una intervención relacional en primera persona logra recuperar el comportamiento de un modelo colapsado, mientras que solo estructura o solo registro no bastan.

2026-06-02 · 2 min

AnyEdit++: Edición Adaptativa de Conocimiento en Formato Largo mediante Sorpresa Bayesiana

AnyEdit++ edita conocimiento en modelos de lenguaje con segmentación adaptativa basada en sorpresa bayesiana, mejorando coherencia y precisión.

2026-06-02 · 3 min

Utilidad empresarial de los LLM como agentes de Análisis Exploratorio de Datos

¿Son los LLM fiables para el análisis exploratorio de datos? Este estudio revela que solo GPT-5.4 ofrece calidad y repetibilidad aceptables.

2026-06-02 · 2 min

Plausibilidad no es predicción: evidencia contrastiva en perturbaciones con LLM

Los LLMs fallan al predecir efectos de perturbaciones celulares. CORE organiza evidencia contrastiva para mejorar la precisión hasta un 28.6%. Descubre cómo.

2026-06-02 · 1 min

Multilingüismo de los modelos de lenguaje grandes desde una perspectiva estructural

Descubre cómo los modelos de lenguaje grandes representan diferentes idiomas desde un punto de vista estructural y qué diferencias clave existen entre lenguas de bajos y altos recursos.

2026-06-02 · 1 min

Repensando el rol de la temperatura en destilación de LLMs

La temperatura transforma la destilación de LLMs: a altas temperaturas, FKL supera a RKL. Aprende a optimizar la transferencia de conocimiento.

2026-06-02 · 2 min

Ambigüedad en la predicción de errores con cuantificación de incertidumbre

Descubre cómo la ambigüedad afecta la predicción de errores en LLMs y cómo desenredarla mejora la precisión hasta en 10 puntos de PRR.

2026-06-02 · 2 min

SPADER: Recompensas de Exploración con Diversidad para QA Multi-Respuesta

SPADER utiliza aprendizaje por refuerzo con recompensas de exploración diversa para mejorar el recuerdo y F1 en QA multi-respuesta.

2026-06-02 · 2 min

CARE-RL: Mitigando Conflictos entre Dominios con RL Consciente de Capacidades

Descubre cómo CARE-RL mitiga conflictos entre dominios en LLMs con aprendizaje por refuerzo consciente de capacidades, con resultados superiores en benchmarks.

2026-06-02 · 2 min

MemGraphRAG: Sistema Multiagente con Memoria para Generación Aumentada en Grafos

MemGraphRAG: sistema multiagente con memoria que optimiza la construcción de grafos en RAG, eliminando conflictos y mejorando la recuperación de información compleja.

2026-06-02 · 1 min

MESA: Alineación de seguridad descentralizada para MoE

MESA mejora la alineación de seguridad en modelos MoE mediante la descentralización de expertos. Logra robustez sin sacrificar rendimiento.

2026-06-02 · 1 min

La paradoja de la optimización por resultados en LLMs

Los LLMs optimizados por resultados alcanzan altos benchmarks pero colapsan en razonamiento. Te explicamos la paradoja y cómo los modelos de recompensa de procesos la resuelven.

2026-06-02 · 1 min

El enigma de la razón artificial: ¿por qué los LRM fallan al evaluar?

Descubre por qué los modelos de razonamiento (LRM) fallan al evaluar soluciones, pese a generarlas. Analizamos el sesgo de confirmación y el dataset VAIR.

2026-06-02 · 2 min

Entrenamiento eficiente de LLMs con dispersión dinámica

Descubre cómo SMET mejora el entrenamiento disperso dinámico de LLMs, eliminando picos de pérdida y reduciendo el uso de memoria. ¡Optimiza tu modelo!

2026-06-02 · 2 min

Inferencia de bajo bit extremo en modelos de razonamiento: fallos y recuperación

Descubre cómo la inferencia 2-bit en modelos de razonamiento genera fallos como bucles y cómo la planificación y rescate recuperan precisión hasta 87%.

2026-06-02 · 2 min