#modelos de lenguaje grandes

¿Qué deben decir los agentes? Comunicación acción-estado eficiente

Descubre cómo PACT optimiza la comunicación acción-estado en MAS, reduciendo tokens y mejorando rendimiento. ¡Ahorra costos!

2026-06-06 · 2 min

ReTreVal: Razonamiento en Árbol con Validación y Memoria entre Problemas

ReTreVal permite a LLMs aprender entre problemas durante la inferencia, mejorando el razonamiento sin ajuste fino. Logra 85.8% en MATH-500 y 54.4% en MMLU-Pro.

2026-06-06 · 2 min

ReasoningFlow: Estructuras discursivas en trazas de LLM

ReasoningFlow revela patrones discursivos en trazas de LLM, mejorando la transparencia y el análisis del razonamiento automático.

2026-06-06 · 2 min

Alpha-RTL: Entrenamiento en tiempo de prueba para optimización de hardware RTL

Descubre cómo Alpha-RTL reduce el producto PPA en un 65% mediante entrenamiento en tiempo de prueba con retroalimentación EDA, superando métodos tradicionales.

2026-06-05 · 3 min

Razonamiento latente con flujos normalizadores

NF-CoT: razonamiento latente con flujos normalizadores para código eficiente y preciso. Supera a la cadena de pensamiento tradicional.

2026-06-05 · 3 min

Ranking consciente de jueces para evaluar LLMs sin verdad de campo

Descubre cómo este marco de ranking consciente de jueces mejora evaluaciones de LLMs sin etiquetas de referencia, optimizando fiabilidad y eficiencia.

2026-06-05 · 2 min

Aprendizaje de compresión de subespacios para paralelismo eficiente en pipeline

MAPL comprime activaciones en paralelismo de tubería con proyecciones ortogonales aprendidas, reduce comunicación sin pérdida de rendimiento en modelos LLaMA.

2026-06-05 · 3 min

Meta-aprendizaje para enrutar LLMs según preferencias de costo-rendimiento

Optimiza el uso de modelos de lenguaje: MetaRouter utiliza meta-aprendizaje para personalizar el enrutamiento según tus necesidades, reduciendo costes sin sacrificar rendimiento.

2026-06-05 · 2 min

Recover-LoRA: Recuperando precisión en cuantización agresiva de 2 bits

Recover-LoRA recupera hasta 95% de precisión en modelos de 2 bits usando adaptación de bajo rango y destilación con solo 10k datos sintéticos.

2026-06-04 · 2 min

Detección de alucinaciones en modelos de lenguaje con conciencia geométrica

Descubre cómo GA-ICL, un método de selección de ejemplos con conciencia geométrica, mejora la detección de alucinaciones en LLMs sin modificar parámetros.

2026-06-04 · 3 min

Entrelazamiento de valores: confusión entre lo moral, gramatical y económico en LLMs

Investigación revela que los modelos de lenguaje grandes confunden el valor moral, gramatical y económico. Descubre cómo la ablación selectiva corrige este entrelazamiento y mejora la alineación.

2026-06-04 · 2 min

SFMP: Cuantización mixta fina y sin búsqueda para LLMs

SFMP: cuantización mixta sin búsqueda y amigable con hardware para LLMs. Reduce costos y mejora eficiencia.

2026-06-04 · 1 min

Marco de variables latentes para leyes de escalado en LLMs

Descubre un nuevo marco estadístico con variables latentes para predecir rendimiento de LLMs en múltiples benchmarks. Ideal para entender leyes de escalado.

2026-06-04 · 2 min

¿Pueden los LLMs generalizar procedimientos entre representaciones?

Descubre cómo un currículo de RL permite a LLMs generalizar procedimientos entre código y lenguaje natural, igualando a GPT-4o.

2026-06-04 · 1 min

Policy Split: Exploración de modo dual en RL para LLM

Descubre cómo Policy Split mejora la exploración dual en LLMs con regularización de entropía para mayor precisión y creatividad.

2026-06-04 · 2 min

Inferencia Aumentada Generativa: análisis causal combinando IA y humanos

Aprende cómo Generative Augmented Inference (GAI) combina datos de IA y humanos para una inferencia causal más precisa, reduciendo errores y mejorando intervalos de confianza.

2026-06-04 · 2 min

Atribución de datos en LLMs mediante gradiente bidireccional

Descubre cómo la optimización de gradiente bidireccional permite atribuir datos de entrenamiento en LLMs, mejorando la interpretabilidad y accountability de los sistemas de IA.

2026-06-04 · 2 min

MorphoQuant: Cuantización Consciente de la Modalidad para LLMs Omni-Modales

Descubre MorphoQuant, un marco de cuantización que mantiene la precisión en modelos omni-modales con solo 4 bits, superando a modelos de 16 bits en ScienceQA.

2026-06-04 · 2 min

DSIRM: Aprendizaje de Identificadores Semánticos para Relevancia en E-commerce

DSIRM mejora la relevancia en búsqueda de e-commerce con identificadores semánticos discretos y cuantización contrastiva, logrando +1.54% AUC y +0.13% UCTR.

2026-06-04 · 2 min

Investigación profunda auto-evolutiva mediante generación y evaluación conjunta

Aprende cómo el marco SCORE mejora informes de investigación mediante la co-evolución de generación y evaluación, superando recompensas fijas.

2026-06-04 · 1 min