#optimizado

Repensando las divergencias de Bregman en optimizadores Kronecker

Descubre cómo las divergencias de Bregman distribuyen el error de aproximación espectral en optimizadores Kronecker y la propuesta de un optimizador adaptativo.

2026-06-02 · 1 min

Aprendizaje Subliminal: Destilación de Vectores de Dirección

El aprendizaje subliminal en modelos de lenguaje se produce por la destilación de un vector de dirección. Te explicamos este fascinante fenómeno y sus implicaciones.

2026-06-02 · 2 min

LiMuon: Optimizador Muon Ligero y Rápido para Modelos Grandes

Descubre LiMuon, el optimizador ligero y rápido que reduce memoria y complejidad muestral para entrenar modelos grandes. ¡Mejor rendimiento!

2026-06-01 · 2 min

Aprendizaje de un optimizador de orden cero para LLMs

Descubre cómo ZO-Finetuner optimiza el ajuste de LLMs sin retropropagación, reduciendo el uso de memoria y mejorando el rendimiento en múltiples tareas.

2026-06-01 · 2 min

Optimizador basado en atención para buscar simetrías

Descubre cómo un optimizador basado en atención encuentra simetrías en Hamiltonianos de Pauli usando IA, superando métodos tradicionales en modelos de Ising y Toric.

2026-06-01 · 3 min

Parallax: Atención Local Lineal que Mantiene Softmax y Corrige

Parallax: atención local lineal que mantiene softmax y añade corrección de covarianza. Duplica eficiencia en GPUs para LLMs.

2026-06-01 · 2 min