Aprendizaje en el estado recurrente: descenso de gradiente con redes lineales La arquitectura GRIL permite a redes recurrentes lineales realizar descenso de gradiente en una sola pasada, aprendiendo en contexto de forma eficiente para 2026-06-16 · 2 min