#ajuste fino

TamperBench: Evaluación de seguridad en LLM bajo ajuste y manipulación

Descubre TamperBench, el primer marco unificado para evaluar la resistencia de LLMs a manipulaciones y ajustes finos. Resultados clave y código abierto.

2026-06-04 · 3 min

Adaptación zero-shot y one-shot de SLMs en interacción líder-seguidor

SLMs ajustados con zero-shot logran 86.66% de precisión en roles líder-seguidor, superando a prompts. Ideal para computación edge.

2026-06-04 · 1 min

Codificadores Visuales con Estado para Modelos de Visión-Lenguaje

Codificadores visuales con estado mejoran la comparación entre imágenes en modelos de visión-lenguaje, superando a especialistas en radiología y teledetección.

2026-06-04 · 2 min

Codificadores visuales con estado para modelos visión-lenguaje

Descubre cómo los codificadores visuales con estado mejoran los modelos visión-lenguaje en tareas multi-imagen y superan a modelos en radiología y teledetección

2026-06-04 · 3 min

Transmutar prompts en pesos: edición directa de modelos de IA

Nuevo algoritmo transforma prompts en vectores y matrices de peso para editar modelos de lenguaje. Ahorra tiempo y mejora el control sin reentrenar.

2026-06-04 · 1 min

Componentes no suaves optimizan el ajuste fino de Vision Transformer

Descubre cómo los componentes no suaves en Vision Transformer mejoran el ajuste fino. La plasticidad de atención y feedforward supera al smoothness tradicional.

2026-06-04 · 2 min

Razonamiento eficiente en el borde

Guía para lograr razonamiento eficiente de LLM en dispositivos de borde. Usamos LoRA, ajuste fino y refuerzo para reducir tokens y latencia sin perder precisión.

2026-06-04 · 2 min

Pocos tokens, gran apalancamiento: preservando la alineación de seguridad durante el ajuste fino

Preserva la alineación de seguridad de tus LLMs durante el fine-tuning con PACT: restricciones focalizadas en tokens de seguridad que evitan la deriva sin sacrificar rendimiento.

2026-06-04 · 2 min

Policy Split: Exploración de modo dual en RL para LLM

Descubre cómo Policy Split mejora la exploración dual en LLMs con regularización de entropía para mayor precisión y creatividad.

2026-06-04 · 2 min

La (mala) generalización del ajuste fino útil

Descubre por qué los modelos entrenados para ser siempre útiles pueden presentar fallos inesperados de alineación, sycophancy y falta de control. Aprende cómo mitigarlos.

2026-06-04 · 2 min

Calificación automática de C++ con BART y rúbricas

Descubre cómo mejora la calificación automática de tareas C++ con BART y rúbricas: menor error y distribuciones de notas más realistas.

2026-06-03 · 2 min

BaltiVoice: Corpus de voz y sistema Whisper ASR ajustado para el balti

Descubre BaltiVoice, el primer corpus de voz público para el idioma balti. Ajustamos Whisper y reducimos el error de 182% a 30%. ¡Modelo y demo disponibles!

2026-06-03 · 2 min

Recuperación del modelo del mundo en planificadores LLM ajustados

¿Aprenden los LLM a representar el modelo del mundo al planificar? Este análisis revela cómo el ajuste supervisado codifica la validez de acciones y predicados.

2026-06-03 · 2 min

SEFT: Ajuste fino disperso para LLMs con evolución de la dispersión

Descubre SEFT, un método de ajuste fino que permite a los LLMs dispersos evolucionar su estructura manteniendo eficiencia. Supera a métodos existentes.

2026-06-03 · 2 min

FGRPO: Federated GRPO con Agregación Adaptativa en Datos No IID

FGRPO optimiza modelos de razonamiento con agregación adaptativa en datos no IID, preservando privacidad.

2026-06-03 · 2 min

DECA: Descentralizando el Ajuste Fino Completo de LLMs

Descubre DECA, el ajuste fino completo descentralizado para LLMs con Adam por bloques y datos no IID.

2026-06-03 · 1 min

DECA: Ajuste Fino Completo Descentralizado de LLMs en Datos No IID

Descubre DECA: ajuste fino completo descentralizado de LLMs en datos no IID. Eficiente y rápido. ¡Infórmate!

2026-06-03 · 2 min

ParaBlock: Aprendizaje Federado con Bloques Coordinados en Paralelo

Descubre ParaBlock: una técnica innovadora que acelera el aprendizaje federado de grandes modelos de lenguaje al paralelizar comunicación y computación, manteniendo el rendimiento.

2026-06-03 · 2 min