#alineación de llms

CuMA: Mezcla de adaptadores para alinear LLMs a valores culturales dispersos

CuMA: Mezcla de adaptadores para alinear LLMs a valores culturales dispersos

CuMA alinea modelos de lenguaje a valores culturales usando mezcla de adaptadores, evitando el colapso medio y preservando la pluralidad cultural.

2026-06-12 · 2 min

CS-RLHF: Alineación Segura de LLMs con Optimización de Penalización Fija

CS-RLHF: Alineación Segura de LLMs con Optimización de Penalización Fija

Descubre CS-RLHF: alinea LLMs de forma segura con penalización fija, 5x más eficiente contra jailbreaks. ¡Seguridad certificable!

2026-06-11 · 2 min

AdaJudge: Modelado de Recompensas Adaptativo Multi-Perspectiva

AdaJudge: Modelado de Recompensas Adaptativo Multi-Perspectiva

Descubre AdaJudge: mejora la discriminación fina y la agregación adaptativa para modelar recompensas en LLMs, superando modelos tradicionales.

2026-06-08 · 1 min

Alineación de LLMs en test-time con muestreo de importancia en pre-logits

Alineación de LLMs en test-time con muestreo de importancia en pre-logits

AISP alinea LLMs en tiempo de prueba usando muestreo de importancia en pre-logits. Logra mayores recompensas que best-of-n sin fine-tuning.

2026-06-04 · 2 min