Dataset EDGAR de Stanford: preentrenamiento eficiente para finanzas Dataset abierto de presentaciones SEC con 152B tokens, fiel al diseño. Ideal para entrenar LLMs en finanzas. Benchmarks: EDGAR-Forecast y EDGAR-OCR. 2026-06-17 · 2 min