研究
gpt-researcher avatar

gpt-researcher

GPT Researcher 是一个自主 AI 代理,专为全面的网页与本地研究而设计,采用规划-执行-发布架构,可产出详尽且具引用的研究报告。

简介

GPT Researcher 是一个基于大型语言模型的开源自主代理,旨在解决传统研究中信息浅显、偏见与人工耗时的问题。通过“规划-执行-发布”模式,它能自动化整个研究生命周期,从查询多元网页来源到合成事实正确、无偏见且附带引用的报告。专为需要超越传统 LLM 限制、追求深度与可靠性的开发人员、分析师与研究者而设计。

  • 在“深度研究”(Deep Research) 模式下采用递归树状探索策略,以高广度与深度探讨复杂课题。

  • 支持多来源检索,包括网页搜索、本地文件,以及与 MCP (Model Context Protocol) 数据源整合,适用于专业内部数据。

  • 平行化代理工作架构确保报告生成的快速性,同时维持高度的准确度与确定性。

  • 支持 Markdown、PDF 与 Word 等多元输出格式,并提供基于 WebSocket 的实时进度流,方便 UI 整合。

  • 通过集中式 Config 系统实现研究工作流的客制化,支持自定义 Prompt、多样化检索器类型及 API 管理。

  • 内建“规划并解决”(Plan-and-Solve) 方法与基于 RAG 的合成技术,减少幻觉并确保跨 20 个以上来源的事实一致性。

  • 开发人员可通过 Python 中的 GPTResearcher 类进行整合,以编程方式触发后端服务中的研究管线。

  • 通过环境变量 (如 TAVILY_API_KEYOPENAI_API_KEY) 或 default.py 配置文件配置研究行为,针对 LLM 提供者与搜索深度进行细部调控。

  • 开发自定义功能时,请遵循八步骤开发模式:包括配置注册、提供者配置、技能实现及 WebSocket 流处理。

  • 建立自定义检索器时,继承核心搜索框架以启用与新数据源 (如内部数据库或向量存储) 的连接。

  • 务必使用 asyncio 异步处理研究任务,避免阻塞主事件循环并确保长时间研究作业的稳定执行。

  • 整合至 NextJS 等前端框架时,利用 stream_output 方法为用户提供即时的反馈与执行进度。

仓库统计

Star 数
26,842
Fork 数
3,595
Open Issue 数
215
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年5月3日 16:16
在 GitHub 查看