gpt-researcher

简介

GPT Researcher 是一个基于大型语言模型的开源自主代理，旨在解决传统研究中信息浅显、偏见与人工耗时的问题。通过“规划-执行-发布”模式，它能自动化整个研究生命周期，从查询多元网页来源到合成事实正确、无偏见且附带引用的报告。专为需要超越传统 LLM 限制、追求深度与可靠性的开发人员、分析师与研究者而设计。

在“深度研究”(Deep Research) 模式下采用递归树状探索策略，以高广度与深度探讨复杂课题。
支持多来源检索，包括网页搜索、本地文件，以及与 MCP (Model Context Protocol) 数据源整合，适用于专业内部数据。
平行化代理工作架构确保报告生成的快速性，同时维持高度的准确度与确定性。
支持 Markdown、PDF 与 Word 等多元输出格式，并提供基于 WebSocket 的实时进度流，方便 UI 整合。
通过集中式 Config 系统实现研究工作流的客制化，支持自定义 Prompt、多样化检索器类型及 API 管理。
内建“规划并解决”(Plan-and-Solve) 方法与基于 RAG 的合成技术，减少幻觉并确保跨 20 个以上来源的事实一致性。
开发人员可通过 Python 中的 GPTResearcher 类进行整合，以编程方式触发后端服务中的研究管线。
通过环境变量 (如 TAVILY_API_KEY、OPENAI_API_KEY) 或 default.py 配置文件配置研究行为，针对 LLM 提供者与搜索深度进行细部调控。
开发自定义功能时，请遵循八步骤开发模式：包括配置注册、提供者配置、技能实现及 WebSocket 流处理。
建立自定义检索器时，继承核心搜索框架以启用与新数据源 (如内部数据库或向量存储) 的连接。
务必使用 asyncio 异步处理研究任务，避免阻塞主事件循环并确保长时间研究作业的稳定执行。
整合至 NextJS 等前端框架时，利用 stream_output 方法为用户提供即时的反馈与执行进度。

创业课程

在线课程

实体课程

简介

仓库统计