#optimización de modelos

Aprendizaje de autocorrección en modelos visión-lenguaje mediante aumento de trayectorias

Descubre cómo Octopus-8B logra autocorrección eficiente en VLMs mediante aumento de trayectorias, superando a otros modelos con un 1.0 de puntuación y menor tiempo de entrenamiento.

2026-06-05 · 2 min

DP-MacAdam: Mecanismo Diferencialmente Privado con Recorte y Momentum Adaptativos

Descubre DP-MacAdam, un mecanismo que combina recorte y momentum adaptativos para entrenar modelos con privacidad diferencial y mayor utilidad.

2026-06-05 · 2 min

Menos es MoE: Recortando expertos en modelos de lenguaje especializados por dominio

Descubre cómo Fisher-MoE recorta dimensiones intermedias para comprimir modelos MoE al 50%, reduciendo memoria un 45% y acelerando inferencia un 21% sin perder capacidad.

2026-06-05 · 2 min

Aprendiendo qué olvidar: mejora del unlearning en LLMs

Descubre cómo ATWU mejora el desaprendizaje en LLMs aprendiendo importancia de tokens sin supervisión, logrando equilibrio óptimo entre olvido y retención.

2026-06-05 · 2 min

QuBLAST: Cuantización con Compresión por Bloques y Escalado de Activaciones

Descubre QuBLAST, un framework que reduce el tamaño de LLMs hasta un 45% mediante cuantización por bloques y escalado de activaciones, sin perder rendimiento.

2026-06-04 · 3 min

SkillDAG: Gráficos de Habilidades Tipados Auto-Evolutivos para Selección de LLM

Descubre SkillDAG: un sistema de grafos auto-evolutivos que optimiza la selección de habilidades en LLM, mejorando el éxito hasta un 67.1% en pruebas.

2026-06-03 · 2 min

PrimeSVT: Poda Automática con Memoria para Transformers de Visión Spiking

Descubre cómo PrimeSVT automatiza la poda de Transformers de Visión Spiking, reduciendo memoria un 26.68% con mínima pérdida de precisión. Optimiza tus modelos.

2026-06-03 · 2 min

Cuando la atención colapsa: poda de tokens visuales de estructura a semántica

Descubre cómo el marco STS evita el colapso de atención en VLMs, mejorando la diversidad estructural y la relevancia semántica de tokens visuales.

2026-06-03 · 2 min

SEFT: Ajuste fino disperso para LLMs con evolución de la dispersión

Descubre SEFT, un método de ajuste fino que permite a los LLMs dispersos evolucionar su estructura manteniendo eficiencia. Supera a métodos existentes.

2026-06-03 · 2 min

Align-KD: destilando conocimiento de alineación multimodal para VLMs móviles

Descubre Align-KD, técnica que destila conocimiento de alineación multimodal de VLMs grandes a modelos móviles, mejorando precisión en 6 benchmarks.

2026-06-03 · 2 min

Destilar luego Reemplazar: Modelos Híbridos de Atención Eficientes

DtR transforma transformers preentrenados en modelos híbridos eficientes mediante destilación y reemplazo de capas. Obtén precisión con menor costo computacional.

2026-06-03 · 1 min

GFFMERGE: Fusión eficiente de campos de fuerza con GNN

Acelera tus simulaciones atomísticas con GFFMERGE, la fusión eficiente de modelos GNN. Logra hasta 27x de velocidad sin reentrenamiento.

2026-06-03 · 3 min

Poda de redes neuronales post-entrenamiento con curvatura de grafos

Descubre cómo la curvatura de grafos permite podar redes neuronales sin perder precisión. Técnica innovadora basada en Ollivier-Ricci para identificar conexiones clave.

2026-06-03 · 2 min

Autoencoders Variacionales Hipersféricos con Cauchy Esférica Eficiente

VAEs hipersféricos con Cauchy esférica: más eficiente y estable que vMF. Ideal para datos complejos.

2026-06-02 · 2 min

El razonamiento latente en TRMs es un operador de mejora de política

En TRMs, el razonamiento latente actúa como operador de mejora de política. Con RL y difusión, reducimos 18x los pasos.

2026-06-02 · 2 min

Destilación On-Policy en Región de Confianza

TrOPD estabiliza la destilación on-policy en LLMs con regiones de confianza. Supera a OPD, EOPD y REOPOLD en razonamiento y código. ¡Descubre cómo!

2026-06-02 · 2 min

IDLM: modelos de lenguaje de difusión inversa 64x más rápidos

IDLM acelera modelos de lenguaje de difusión hasta 64x sin perder calidad. Optimiza la generación de texto con destilación inversa. ¡Descubre más!

2026-06-02 · 2 min

Mezcla dinámica proxy: ajuste continuo de modelos de lenguaje

PROXYMIX utiliza mezcla dinámica proxy para transferir controladores de repetición, mejorando precisión y seguridad en el ajuste continuo de instrucciones.

2026-06-02 · 3 min