#ajuste

Aprendizaje de un optimizador de orden cero para LLMs

Descubre cómo ZO-Finetuner optimiza el ajuste de LLMs sin retropropagación, reduciendo el uso de memoria y mejorando el rendimiento en múltiples tareas.

2026-06-01 · 2 min

Reexaminando la adaptación de bajo rango para ajuste fino privado de LLMs

Descubre cómo restaurar el rápido decaimiento de valores singulares mejora la eficiencia del ajuste fino privado de LLMs con DP-SGD, sin comprometer privacidad.

2026-06-01 · 2 min

Go-UT-Bench: Dataset de ajuste fino para tests unitarios en Go

Descubre Go-UT-Bench, dataset para ajustar LLMs que mejora tests unitarios en Go. Modelos ajustados superan en más del 75% a los base. ¡Optimiza!

2026-06-01 · 2 min

Inferencia determinista con paralelismo tensorial sin desajuste

Descubre cómo los kernels invariantes de árbol garantizan inferencia determinista con resultados bit a bit idénticos, eliminando el desajuste entre entrenamiento e inferencia en LLMs.

2026-06-01 · 2 min

Adaptación de dominio y razonamiento: experimento con cosmología histórica

Un experimento con cosmología histórica revela cómo la adaptación de dominio cambia los marcos explicativos en modelos de lenguaje.

2026-06-01 · 2 min

Honestidad y credulidad de LLMs como agentes negociadores

Descubre cómo los LLMs negocian en simulaciones de compra-venta. ¿Son honestos o aprovechan la asimetría de información? Análisis de su credulidad y rendimiento.

2026-06-01 · 2 min

¿Qué se descubre primero? Análisis de difusión para texto desde gráficos

Estudio revela que MDLMs descifran entidades primero en generación texto-gráfico. SFT puede fallar, pero decodificación lambda recupera +9.4 BLEU.

2026-06-01 · 2 min

Unificación y optimización de valores de datos en selección secuencial

Descubre cómo un nuevo enfoque unifica y optimiza la valoración de datos usando decisiones secuenciales, mejorando la selección en LLM y benchmarks clásicos.

2026-06-01 · 1 min

Optimización post-entrenamiento de LLMs para decisiones con mínimo arrepentimiento

Mejora la toma de decisiones de los LLMs con Iterative RMFT: un método que minimiza el arrepentimiento y optimiza el equilibrio exploración-explotación.

2026-06-01 · 2 min

PRISM: Selección Intrínseca de Datos Multimodales sin Entrenamiento

Descubre PRISM, un método que selecciona datos de instrucción visual sin entrenamiento, reduciendo costes y mejorando el rendimiento de modelos multimodales.

2026-06-01 · 2 min

Los modos de fallo de PINNs son sobreajuste

Descubre cómo el sobreajuste provoca fallos en PINNs y cómo la regularización y el doble backpropagation permiten resolver ecuaciones con menos puntos de colocación.

2026-06-01 · 3 min

Difusión No Supervisada para Optimización Combinatoria vía Ajuste Adjunto

Descubre CAM, un método no supervisado de difusión para optimización combinatoria que supera soluciones supervisadas. Resultados competitivos sin datos etiquetados.

2026-06-01 · 2 min

Portafolios de Recuperadores: Enfoque Principiado para RAG Adaptativo

Descubre cómo los portafolios de recuperadores optimizan RAG: selección automática de múltiples recuperadores para mejorar precisión y reducir latencia en QA.

2026-06-01 · 2 min

DRIFT: Optimización eficiente de modelos de lenguaje en múltiples turnos

DRIFT optimiza modelos de lenguaje en múltiples turnos con eficiencia de SFT y rendimiento de RL. Descubre cómo.

2026-06-01 · 2 min

Balanced LoRA: Eliminando invariancia de parámetros para acelerar convergencia

Acelera tu fine-tuning con BaLoRA: elimina invariancia de parámetros para convergencia más rápida y mejor rendimiento.

2026-06-01 · 2 min

El decaimiento de peso mejora la plasticidad de modelos de lenguaje

Descubre cómo un mayor weight decay durante el preentrenamiento puede mejorar la plasticidad de los LLM, generando mejor rendimiento tras el fine-tuning.

2026-06-01 · 3 min