#rlsr

RLSR: aprendizaje por refuerzo para reescritura de fuentes en MT

RLSR entrena un modelo de reescritura de 4B con aprendizaje por refuerzo, mejorando la traducción automática en 16 pares de lenguas y superando a modelos de

2026-06-16 · 2 min