EdgarTools
一个用于查询、解析并将 SEC EDGAR 申报文件、财务报表及机构持股数据转化为结构化 Python 对象的完整程序库。
简介
EdgarTools 是一个 AI 原生 Python 程序库,旨在将原始的 SEC EDGAR 申报数据转换为可操作的结构化 Python 对象。它消除了手动网页抓取、HTML 解析或处理原始 XML/XBRL 的复杂性,为财务专业人士、研究人员和 AI 代理提供了一致的 API。该工具针对高性能数据提取进行了优化,允许用户只需几行代码,即可从 CIK 查询或基于代码的公司识别过渡到深入的财务分析。
-
全面支持 20 多种申报类型,包括 10-K、10-Q、8-K、13F 和 Form 4(内部交易)。
-
先进的财务报表解析功能,可直接将表格转换为 pandas DataFrames 以进行即时分析。
-
原生支持 XBRL(可扩展商业报告语言),用于跨公司比较和底层事实提取。
-
内置 MCP(模型上下文协议)服务器,用于与基于大型语言模型的代理集成,允许对 SEC 申报文件进行自主推理。
-
高性能 HTML 解析引擎,利用多策略章节检测技术高效处理大型文档。
-
针对特定领域分析的专用模块,例如业务开发公司 (BDC)、机构持股和内部人所有权。
-
通过所有对象上的 .docs 接口进行 API 发现,在开发环境中提供实时协助和方法说明。
-
用户应使用电子邮件地址调用 set_identity() 以识别发送到 SEC EDGAR API 的请求。
-
该程序库设计为具备速率限制感知能力;请使用内置的缓存机制来优化性能并防止网络瓶颈。
-
输入通常包含公司代码 (Ticker)、CIK 号码或特定的存取编号 (Accession Number);输出为类型的 Python 对象、DataFrames 或清理后的文本。
-
非常适合需要历史财务数据的量化研究人员、追踪内部交易的审计员,以及开发财务 AI 代理的开发人员。
-
该工具利用 lxml 和 PyArrow 进行高效处理,使其适用于大规模数据搜集或生产级财务应用。
仓库统计
- Star 数
- 2,086
- Fork 数
- 355
- Open Issue 数
- 16
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 21:34