#ajuste fino

DataShield: Filtrado de datos que degradan seguridad en ajuste benigno de LLM

DataShield identifica eficientemente muestras que degradan seguridad en el ajuste benigno de LLMs. Protege tus modelos con esta innovadora solución.

2026-06-02 · 2 min

Ajuste fino justo mitiga ataques de inferencia de distribución

Ajuste fino justo reduce ataques de inferencia de distribución. Conoce el vínculo entre equidad y privacidad en modelos de IA.

2026-06-02 · 4 min

Ajuste fino eficiente de modelos preentrenados para segmentación de instancias

Descubre cómo el ajuste fino eficiente con adaptadores y LoRA logra segmentar instancias con solo 1-6% de parámetros, manteniendo rendimiento. ¡Optimiza!

2026-06-02 · 3 min

Adaptadores CP: pasos de parámetros más finos en PEFT

Los adaptadores CP ofrecen pasos de parámetros 21 veces más finos que LoRA. ¿Mejoran la precisión? Estudio controlado en OPT-1.3B revela resultados según la tarea.

2026-06-02 · 3 min

Ajuste fino consciente del desbalance en Qwen3-8B para defensa psicológica

Descubre cómo logramos el 4° puesto en PsyDefDetect 2026 usando Qwen3-8B con ajuste fino consciente del desbalance, aumentando el F1 macro un 24.4% sobre la línea base.

2026-06-02 · 2 min

GuidaPA: Chatbot con privacidad para administración pública mediante aprendizaje federado

GuidaPA: chatbot privado para administración pública con aprendizaje federado. Obtén alta calidad sin centralizar datos. ¡Descubre cómo!

2026-06-02 · 2 min

RoleCDE: Evaluación y mitigación de conflictos rol-alineación

RoleCDE es el primer benchmark que mide cómo los agentes de rol resuelven dilemas entre valores específicos y alineación. ¡Aprende a mitigar el desacople de roles!

2026-06-02 · 2 min

Aprendizaje de un optimizador de orden cero para LLMs

Descubre cómo ZO-Finetuner optimiza el ajuste de LLMs sin retropropagación, reduciendo el uso de memoria y mejorando el rendimiento en múltiples tareas.

2026-06-01 · 2 min

Reexaminando la adaptación de bajo rango para ajuste fino privado de LLMs

Descubre cómo restaurar el rápido decaimiento de valores singulares mejora la eficiencia del ajuste fino privado de LLMs con DP-SGD, sin comprometer privacidad.

2026-06-01 · 2 min

Go-UT-Bench: Dataset de ajuste fino para tests unitarios en Go

Descubre Go-UT-Bench, dataset para ajustar LLMs que mejora tests unitarios en Go. Modelos ajustados superan en más del 75% a los base. ¡Optimiza!

2026-06-01 · 2 min

Adaptación de dominio y razonamiento: experimento con cosmología histórica

Un experimento con cosmología histórica revela cómo la adaptación de dominio cambia los marcos explicativos en modelos de lenguaje.

2026-06-01 · 2 min

Honestidad y credulidad de LLMs como agentes negociadores

Descubre cómo los LLMs negocian en simulaciones de compra-venta. ¿Son honestos o aprovechan la asimetría de información? Análisis de su credulidad y rendimiento.

2026-06-01 · 2 min

¿Qué se descubre primero? Análisis de difusión para texto desde gráficos

Estudio revela que MDLMs descifran entidades primero en generación texto-gráfico. SFT puede fallar, pero decodificación lambda recupera +9.4 BLEU.

2026-06-01 · 2 min

Unificación y optimización de valores de datos en selección secuencial

Descubre cómo un nuevo enfoque unifica y optimiza la valoración de datos usando decisiones secuenciales, mejorando la selección en LLM y benchmarks clásicos.

2026-06-01 · 1 min

Optimización post-entrenamiento de LLMs para decisiones con mínimo arrepentimiento

Mejora la toma de decisiones de los LLMs con Iterative RMFT: un método que minimiza el arrepentimiento y optimiza el equilibrio exploración-explotación.

2026-06-01 · 2 min

DRIFT: Optimización eficiente de modelos de lenguaje en múltiples turnos

DRIFT optimiza modelos de lenguaje en múltiples turnos con eficiencia de SFT y rendimiento de RL. Descubre cómo.

2026-06-01 · 2 min

Balanced LoRA: Eliminando invariancia de parámetros para acelerar convergencia

Acelera tu fine-tuning con BaLoRA: elimina invariancia de parámetros para convergencia más rápida y mejor rendimiento.

2026-06-01 · 2 min

El decaimiento de peso mejora la plasticidad de modelos de lenguaje

Descubre cómo un mayor weight decay durante el preentrenamiento puede mejorar la plasticidad de los LLM, generando mejor rendimiento tras el fine-tuning.

2026-06-01 · 3 min