#compresión

Reutilización de habilidades como compresión en RL agentivo

ReuseRL aplica el principio de compresión para que agentes de IA generalicen mejor. Aumenta el éxito en ALFWorld y TextWorld. ¡Descúbrelo!

2026-06-01 · 2 min

Acoplamiento de Subespacios para Compresión de LLM: Límites Empíricos

La optimización conjunta de capas en compresión de LLMs fracasa. El flujo residual desacopla las capas, haciendo clave la reconstrucción por capas.

2026-06-01 · 2 min

Teoría exacta de algoritmos de error feedback en optimización distribuida

Aprende cómo los algoritmos de error feedback logran convergencia óptima en optimización distribuida con compresión de gradientes. Análisis para EF y EF21.

2026-06-01 · 4 min

3DGS más pequeño y rápido mediante aprendizaje de diccionario

Mejora el rendimiento de modelos 3DGS con compresión basada en diccionarios: reduce memoria y acelera el renderizado.

2026-06-01 · 3 min

Archivos ZIP en streaming sobre la marcha con nginx + mod_zip: sin disco, sin búferes, sin problema

Transmite archivos ZIP en tiempo real con nginx y mod_zip: sin disco, sin búferes, sin complicaciones.

2026-06-01 · 2 min

ConMoE: Consolidación del grupo de expertos mediante reasignación de prototipos para la compresión de MoE

ConMoE: consolidación de grupos de expertos con reasignación de prototipos para compresión de MoE. Descubre cómo comprimir modelos MoE optimizando eficiencia y rendimiento.

2026-05-30 · 1 min

Moment-KV: Compresión de Caché KV en Tiempo de Decodificación Basada en Momento para Generación Larga

2026-05-30 · 1 min

Acelerando la decodificación restringida con compresión del espacio de tokens

Acelera la decodificación restringida comprimiendo tokens. Optimiza modelos de lenguaje para mayor eficiencia y velocidad.

2026-05-30 · 1 min

OccamToken: Inferencia eficiente de VLM con poda de tokens sin entrenamiento y adaptativa al presupuesto

OccamToken: poda de tokens sin entrenamiento y adaptativa al presupuesto para VLM. Reduce costos computacionales manteniendo precisión.

2026-05-29 · 2 min

AsymVLM: Poda Asimétrica de Tokens para Inferencia Eficiente de Modelos de Visión y Lenguaje

Poda asimétrica de tokens para inferencia eficiente en VLM. Acelera modelos de visión-lenguaje sin sacrificar precisión. Técnica optimizada.

2026-05-29 · 2 min

Problema abierto: Separación de la compresión geométrica y algorítmica mediante la finalización de la tabla de Cayley

Explora la separación entre compresión geométrica y algorítmica mediante tablas de Cayley. Un análisis profundo de técnicas algebraicas de compresión.

2026-05-29 · 2 min

Destilación eficiente con preservación del razonamiento de grandes modelos de lenguaje mediante inicialización consciente de la activación

2026-05-29 · 2 min

Kronecker Embeddings: Representaciones de Tokens Estructuradas a Nivel de Byte para Modelos de Lenguaje Eficientes en Parámetros

2026-05-29 · 2 min

Desaprendizaje de Representaciones: Olvido mediante Compresión de Información

#compresión

Reutilización de habilidades como compresión en RL agentivo

Acoplamiento de Subespacios para Compresión de LLM: Límites Empíricos

Teoría exacta de algoritmos de error feedback en optimización distribuida

3DGS más pequeño y rápido mediante aprendizaje de diccionario

Archivos ZIP en streaming sobre la marcha con nginx + mod_zip: sin disco, sin búferes, sin problema

ConMoE: Consolidación del grupo de expertos mediante reasignación de prototipos para la compresión de MoE

Moment-KV: Compresión de Caché KV en Tiempo de Decodificación Basada en Momento para Generación Larga

Acelerando la decodificación restringida con compresión del espacio de tokens

OccamToken: Inferencia eficiente de VLM con poda de tokens sin entrenamiento y adaptativa al presupuesto

AsymVLM: Poda Asimétrica de Tokens para Inferencia Eficiente de Modelos de Visión y Lenguaje

Problema abierto: Separación de la compresión geométrica y algorítmica mediante la finalización de la tabla de Cayley

Destilación eficiente con preservación del razonamiento de grandes modelos de lenguaje mediante inicialización consciente de la activación

Kronecker Embeddings: Representaciones de Tokens Estructuradas a Nivel de Byte para Modelos de Lenguaje Eficientes en Parámetros

Desaprendizaje de Representaciones: Olvido mediante Compresión de Información

No más K-means: Codificación dispersa de una sola etapa para una recuperación eficiente de múltiples vectores

Menos es más: Elevando RAG mediante compresión de contexto impulsada por rendimiento

ReSpinQuant: Cuantificación eficiente de capa por capa de LLM mediante aproximación de rotación residual en subespacio

Expansión de la Familia LLM Apertus mediante Destilación y Cuantización

ZipRL: Compresión de contexto adaptativa de múltiples turnos con reproducción de respuesta retrospectiva

CIVIC: Compacidad de secuencia de extremo a extremo para modelos eficientes de visión-lenguaje