El análogo de Grokking en el preentrenamiento de modelos de lenguaje Descubre cómo el fenómeno Grokking aparece en el preentrenamiento de LLMs, revelando una generalización gramatical retardada. Análisis de conceptos y atención en cabezas. 2026-06-02 · 3 min