研究
gpt-researcher avatar

gpt-researcher

GPT Researcher 是一個自主 AI 代理,專為全面的網頁與本地研究而設計,採用規劃-執行-發佈架構,可產出詳盡且具引用的研究報告。

簡介

GPT Researcher 是一個基於大型語言模型的開源自主代理,旨在解決傳統研究中資訊淺顯、偏見與人工耗時的問題。透過「規劃-執行-發佈」模式,它能自動化整個研究生命週期,從查詢多元網頁來源到合成事實正確、無偏見且附帶引用的報告。專為需要超越傳統 LLM 限制、追求深度與可靠性的開發人員、分析師與研究者而設計。

  • 在「深度研究」(Deep Research) 模式下採用遞歸樹狀探索策略,以高廣度與深度探討複雜課題。

  • 支援多來源檢索,包括網頁搜尋、本地檔案,以及與 MCP (Model Context Protocol) 資料源整合,適用於專業內部數據。

  • 平行化代理工作架構確保報告生成的快速性,同時維持高度的準確度與確定性。

  • 支援 Markdown、PDF 與 Word 等多元輸出格式,並提供基於 WebSocket 的即時進度串流,方便 UI 整合。

  • 透過集中式 Config 系統實現研究工作流的客製化,支援自定義 Prompt、多樣化檢索器類型及 API 管理。

  • 內建「規劃並解決」(Plan-and-Solve) 方法與基於 RAG 的合成技術,減少幻覺並確保跨 20 個以上來源的事實一致性。

  • 開發人員可透過 Python 中的 GPTResearcher 類別進行整合,以編程式方式觸發後端服務中的研究管線。

  • 透過環境變數 (如 TAVILY_API_KEYOPENAI_API_KEY) 或 default.py 設定檔配置研究行為,針對 LLM 提供者與搜尋深度進行細部調控。

  • 開發自定義功能時,請遵循八步驟開發模式:包括設定註冊、提供者配置、技能實作及 WebSocket 串流處理。

  • 建立自定義檢索器時,繼承核心搜尋框架以啟用與新資料源 (如內部資料庫或向量儲存) 的連接。

  • 務必使用 asyncio 非同步處理研究任務,避免阻塞主事件迴圈並確保長時間研究作業的穩定執行。

  • 整合至 NextJS 等前端框架時,利用 stream_output 方法為使用者提供即時的回饋與執行進度。

倉庫統計

Star 數
26,842
Fork 數
3,595
Open Issue 數
215
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月3日 下午04:16
在 GitHub 查看