Descomponiendo los mecanismos de predicción para el recuerdo en contexto Descubre cómo los transformers desarrollan dos mecanismos separados para recordar y predecir en contexto, revelando fases de aprendizaje sorprendentes. 2026-06-18 · 3 min