Meta-Alineador: Optimización bidireccional de políticas de preferencia para la alineación de LLMs multiobjetivo
<meta name=description content=Meta-Alineador optimiza bidireccionalmente la alineación de LLMs multiobjetivo, mejorando precisión y consistencia en tareas complejas.>