EdgarTools
一個用於查詢、解析並將 SEC EDGAR 申報文件、財務報表及機構持股數據轉化為結構化 Python 物件的完整程式庫。
簡介
EdgarTools 是一個 AI 原生 Python 程式庫,旨在將原始的 SEC EDGAR 申報數據轉換為可操作的結構化 Python 物件。它消除了手動網頁抓取、HTML 解析或處理原始 XML/XBRL 的複雜性,為財務專業人士、研究人員和 AI 代理提供了一致的 API。該工具針對高性能數據提取進行了優化,允許用戶只需幾行程式碼,即可從 CIK 查詢或基於代碼的公司識別過渡到深入的財務分析。
-
全面支援 20 多種申報類型,包括 10-K、10-Q、8-K、13F 和 Form 4(內部交易)。
-
先進的財務報表解析功能,可直接將表格轉換為 pandas DataFrames 以進行即時分析。
-
原生支援 XBRL(可擴展商業報告語言),用於跨公司比較和底層事實提取。
-
內建 MCP(模型上下文協議)伺服器,用於與基於大型語言模型的代理整合,允許對 SEC 申報文件進行自主推理。
-
高性能 HTML 解析引擎,利用多策略章節檢測技術高效處理大型文檔。
-
針對特定領域分析的專用模組,例如業務開發公司 (BDC)、機構持股和內部人所有權。
-
透過所有物件上的 .docs 介面進行 API 發現,在開發環境中提供即時協助和方法說明。
-
用戶應使用電子郵件地址呼叫 set_identity() 以識別發送到 SEC EDGAR API 的請求。
-
該程式庫設計為具備速率限制感知能力;請使用內建的快取機制來優化性能並防止網路瓶頸。
-
輸入通常包含公司代碼 (Ticker)、CIK 號碼或特定的存取編號 (Accession Number);輸出為類型的 Python 物件、DataFrames 或清理後的文本。
-
非常適合需要歷史財務數據的量化研究人員、追蹤內部交易的稽核員,以及開發財務 AI 代理的開發人員。
-
該工具利用 lxml 和 PyArrow 進行高效處理,使其適用於大規模數據蒐集或生產級財務應用。
倉庫統計
- Star 數
- 2,086
- Fork 數
- 355
- Open Issue 數
- 16
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年5月3日 下午09:34