RLSR: aprendizaje por refuerzo para reescritura de fuentes en MT RLSR entrena un modelo de reescritura de 4B con aprendizaje por refuerzo, mejorando la traducción automática en 16 pares de lenguas y superando a modelos de 2026-06-16 · 2 min