Orígenes mecanicistas del olvido catastrófico: ¿por qué el RL preserva circuitos mejor que el SFT? Descubre por qué el Reinforcement Learning (RL) preserva mejor los circuitos que el Supervised Fine-Tuning (SFT). Ventajas clave en ajuste de modelos. 2026-05-30 · 2 min