gpt-researcher
GPT Researcher 是一個自主 AI 代理,專為全面的網頁與本地研究而設計,採用規劃-執行-發佈架構,可產出詳盡且具引用的研究報告。
簡介
GPT Researcher 是一個基於大型語言模型的開源自主代理,旨在解決傳統研究中資訊淺顯、偏見與人工耗時的問題。透過「規劃-執行-發佈」模式,它能自動化整個研究生命週期,從查詢多元網頁來源到合成事實正確、無偏見且附帶引用的報告。專為需要超越傳統 LLM 限制、追求深度與可靠性的開發人員、分析師與研究者而設計。
-
在「深度研究」(Deep Research) 模式下採用遞歸樹狀探索策略,以高廣度與深度探討複雜課題。
-
支援多來源檢索,包括網頁搜尋、本地檔案,以及與 MCP (Model Context Protocol) 資料源整合,適用於專業內部數據。
-
平行化代理工作架構確保報告生成的快速性,同時維持高度的準確度與確定性。
-
支援 Markdown、PDF 與 Word 等多元輸出格式,並提供基於 WebSocket 的即時進度串流,方便 UI 整合。
-
透過集中式
Config系統實現研究工作流的客製化,支援自定義 Prompt、多樣化檢索器類型及 API 管理。 -
內建「規劃並解決」(Plan-and-Solve) 方法與基於 RAG 的合成技術,減少幻覺並確保跨 20 個以上來源的事實一致性。
-
開發人員可透過 Python 中的
GPTResearcher類別進行整合,以編程式方式觸發後端服務中的研究管線。 -
透過環境變數 (如
TAVILY_API_KEY、OPENAI_API_KEY) 或default.py設定檔配置研究行為,針對 LLM 提供者與搜尋深度進行細部調控。 -
開發自定義功能時,請遵循八步驟開發模式:包括設定註冊、提供者配置、技能實作及 WebSocket 串流處理。
-
建立自定義檢索器時,繼承核心搜尋框架以啟用與新資料源 (如內部資料庫或向量儲存) 的連接。
-
務必使用
asyncio非同步處理研究任務,避免阻塞主事件迴圈並確保長時間研究作業的穩定執行。 -
整合至 NextJS 等前端框架時,利用
stream_output方法為使用者提供即時的回饋與執行進度。
倉庫統計
- Star 數
- 26,842
- Fork 數
- 3,595
- Open Issue 數
- 215
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年5月3日 下午04:16