#ortogonal

TWLA: Cuantización con pesos ternarios y activaciones de 4 bits

TWLA permite cuantizar LLMs a pesos ternarios y activaciones de 4 bits, reduciendo el costo de inferencia sin perder precisión.

2026-06-12 · 2 min

PermDoRA: Límites de la geometría en interferencia de adaptadores

La geometría del espacio de parámetros no predice la interferencia al combinar adaptadores en LLMs. Análisis con DoRA-RBAC y benchmarks de QA.

2026-06-11 · 2 min

Enlace recursivo económico: Tallado de subespacios en tensores de orden p

Descubre Orthogonal Subspace Carving: enlace recursivo profundo con memoria constante. Supera TPR y VSA con eficiencia y fidelidad sin crecimiento exponencial.

2026-06-11 · 2 min

Reidentificación Robusta al Cambio de Ropa con Subespacios Ortogonales

Descubre Ortho-ReID, subespacios ortogonales de bajo rango para reidentificar personas con cambio de ropa. Supera en hasta un 5.9% a los mejores.

2026-06-11 · 2 min

Rotate2Think: cómo la rotación ortogonal mejora el razonamiento de modelos de IA

Rotate2Think mejora el razonamiento de modelos de lenguaje con rotación ortogonal. Aumenta precisión en matemáticas, ciencia y código sin entrenamiento.

2026-06-10 · 2 min

Procrustes Ortogonal Preserva Correlaciones en Datos Sintéticos

Aprende cómo el problema de Procrustes restaura la correlación en datos sintéticos, preservando distribuciones y rendimiento.

2026-06-10 · 2 min

Explorando la Adaptación de Dominio Precisa y Transparente en Salud Predictiva

Descubre cómo ExtraCare logra predicciones precisas y explicables en salud al descomponer representaciones de pacientes en componentes invariantes y covariantes. Ideal para la práctica clínica.

2026-06-10 · 2 min

Redes Neuronales Temporales Sheaf con Transporte Ortogonal Dinámico

Descubre cómo las redes neuronales sheaf temporales mejoran la predicción de enlaces en grafos con evolución temporal, usando marcos ortogonales dinámicos y transporte local.

2026-06-10 · 2 min

FOGO: Optimizador de Ortogonalización Consciente del Olvido

Descubre FOGO, un optimizador que previene el olvido en el entrenamiento de modelos de IA, mejorando la convergencia y retención sin almacenar datos. Ideal para aprendizaje continuo.

2026-06-10 · 3 min

POET-X: Entrenamiento eficiente de LLMs con transformaciones ortogonales

Descubre POET-X, el método que entrena LLMs de miles de millones de parámetros en una sola GPU H100 con menor memoria. ¡Optimiza tu entrenamiento!

2026-06-09 · 1 min

Muon²: Potenciando Muon con precondicionamiento adaptativo de segundo momento

Muon² reduce un 40% las iteraciones Newton-Schulz y ahorra hasta 25% del tiempo de entrenamiento. Descubre cómo.

2026-06-09 · 1 min

Factorización triple ortogonal no negativa para matrices simétricas

Descubre cómo resolver el problema de factorización triple de matrices no negativas ortogonales simétricas con dos nuevos algoritmos heurísticos. Aplicaciones en clustering y redes.

2026-06-09 · 3 min

Resolviendo la factorización tri-matricial no negativa ortogonal simétrica

Resuelve la factorización tri-matricial no negativa ortogonal simétrica. Algoritmos heurísticos para clustering y análisis de redes con resultados competitivos.

2026-06-09 · 3 min

Ortogonalidad y dimensionalidad en clústeres de aerolíneas con PCA y Kernel PCA

Descubre cómo PCA y Kernel PCA revelan la robustez de clústeres en aerolíneas, y por qué el silueta indica solo 3 grupos.

2026-06-09 · 2 min

Ortogonalidad en clústeres de aerolíneas: PCA y Kernel PCA

Descubre cómo PCA y Kernel PCA revelan la estructura oculta en los ciclos de ganancias de aerolíneas estadounidenses (1995-2020).

2026-06-09 · 2 min

OptMuon: Momento Ortogonalizado en Bucle Cerrado para Optimización Estocástica

Descubre OptMuon, optimizador con momento ortogonalizado y control adaptativo en bucle cerrado. Logra tasas óptimas incluso sin ruido. Ideal deep learning.

2026-06-09 · 2 min

POD Multiescala de Atención en Transformers con Morlet

Descubre cómo el POD multiescala con wavelet Morlet extrae modos energéticos de atención en transformers, revelando jerarquía de escalas sin anotaciones.

2026-06-08 · 1 min

CascadeNet: recuperación de redes en cascada con ML insesgado

CascadeNet usa ML y Jacobiano para recuperar redes de influencia ocultas en datos en cascada, con validación en COVID-19.

2026-06-08 · 2 min

ADIGen: generación contrafactual automática, debiasada e invariante

ADIGen genera contrafactuales debiasados e invariantes automáticamente. Aprende cómo su robustez doble mejora la toma de decisiones bajo intervenciones complejas.

2026-06-08 · 3 min

Aprendizaje de compresión de subespacios para paralelismo eficiente en pipeline

MAPL comprime activaciones en paralelismo de tubería con proyecciones ortogonales aprendidas, reduce comunicación sin pérdida de rendimiento en modelos LLaMA.

2026-06-05 · 3 min