資料分析
EdgarTools avatar

EdgarTools

一個用於查詢、解析並將 SEC EDGAR 申報文件、財務報表及機構持股數據轉化為結構化 Python 物件的完整程式庫。

簡介

EdgarTools 是一個 AI 原生 Python 程式庫,旨在將原始的 SEC EDGAR 申報數據轉換為可操作的結構化 Python 物件。它消除了手動網頁抓取、HTML 解析或處理原始 XML/XBRL 的複雜性,為財務專業人士、研究人員和 AI 代理提供了一致的 API。該工具針對高性能數據提取進行了優化,允許用戶只需幾行程式碼,即可從 CIK 查詢或基於代碼的公司識別過渡到深入的財務分析。

  • 全面支援 20 多種申報類型,包括 10-K、10-Q、8-K、13F 和 Form 4(內部交易)。

  • 先進的財務報表解析功能,可直接將表格轉換為 pandas DataFrames 以進行即時分析。

  • 原生支援 XBRL(可擴展商業報告語言),用於跨公司比較和底層事實提取。

  • 內建 MCP(模型上下文協議)伺服器,用於與基於大型語言模型的代理整合,允許對 SEC 申報文件進行自主推理。

  • 高性能 HTML 解析引擎,利用多策略章節檢測技術高效處理大型文檔。

  • 針對特定領域分析的專用模組,例如業務開發公司 (BDC)、機構持股和內部人所有權。

  • 透過所有物件上的 .docs 介面進行 API 發現,在開發環境中提供即時協助和方法說明。

  • 用戶應使用電子郵件地址呼叫 set_identity() 以識別發送到 SEC EDGAR API 的請求。

  • 該程式庫設計為具備速率限制感知能力;請使用內建的快取機制來優化性能並防止網路瓶頸。

  • 輸入通常包含公司代碼 (Ticker)、CIK 號碼或特定的存取編號 (Accession Number);輸出為類型的 Python 物件、DataFrames 或清理後的文本。

  • 非常適合需要歷史財務數據的量化研究人員、追蹤內部交易的稽核員,以及開發財務 AI 代理的開發人員。

  • 該工具利用 lxml 和 PyArrow 進行高效處理,使其適用於大規模數據蒐集或生產級財務應用。

倉庫統計

Star 數
2,086
Fork 數
355
Open Issue 數
16
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月3日 下午09:34
在 GitHub 查看