gpt-researcher
GPT Researcher 是一个自主 AI 代理,专为全面的网页与本地研究而设计,采用规划-执行-发布架构,可产出详尽且具引用的研究报告。
简介
GPT Researcher 是一个基于大型语言模型的开源自主代理,旨在解决传统研究中信息浅显、偏见与人工耗时的问题。通过“规划-执行-发布”模式,它能自动化整个研究生命周期,从查询多元网页来源到合成事实正确、无偏见且附带引用的报告。专为需要超越传统 LLM 限制、追求深度与可靠性的开发人员、分析师与研究者而设计。
-
在“深度研究”(Deep Research) 模式下采用递归树状探索策略,以高广度与深度探讨复杂课题。
-
支持多来源检索,包括网页搜索、本地文件,以及与 MCP (Model Context Protocol) 数据源整合,适用于专业内部数据。
-
平行化代理工作架构确保报告生成的快速性,同时维持高度的准确度与确定性。
-
支持 Markdown、PDF 与 Word 等多元输出格式,并提供基于 WebSocket 的实时进度流,方便 UI 整合。
-
通过集中式
Config系统实现研究工作流的客制化,支持自定义 Prompt、多样化检索器类型及 API 管理。 -
内建“规划并解决”(Plan-and-Solve) 方法与基于 RAG 的合成技术,减少幻觉并确保跨 20 个以上来源的事实一致性。
-
开发人员可通过 Python 中的
GPTResearcher类进行整合,以编程方式触发后端服务中的研究管线。 -
通过环境变量 (如
TAVILY_API_KEY、OPENAI_API_KEY) 或default.py配置文件配置研究行为,针对 LLM 提供者与搜索深度进行细部调控。 -
开发自定义功能时,请遵循八步骤开发模式:包括配置注册、提供者配置、技能实现及 WebSocket 流处理。
-
建立自定义检索器时,继承核心搜索框架以启用与新数据源 (如内部数据库或向量存储) 的连接。
-
务必使用
asyncio异步处理研究任务,避免阻塞主事件循环并确保长时间研究作业的稳定执行。 -
整合至 NextJS 等前端框架时,利用
stream_output方法为用户提供即时的反馈与执行进度。
仓库统计
- Star 数
- 26,842
- Fork 数
- 3,595
- Open Issue 数
- 215
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 16:16