自動化
browser-use avatar

browser-use

基於 Model Context Protocol 的 AI 瀏覽器自動化伺服器,支援網頁互動、數據提取與深度研究。

簡介

此 MCP 伺服器為 AI 助手提供了一個強大的網頁瀏覽器控制介面,實現複雜的網頁自動化與數據提取流程。透過將 browser-use 函式庫封裝於 HTTP 傳輸層,它解決了標準 stdio 通訊中常見的逾時問題,確保能夠執行長達 30 到 120 秒以上的瀏覽器任務。它專為需要自動化互動、進行多來源研究或建立可重複使用瀏覽器工作流的開發者與進階用戶而設計。

  • 完整的瀏覽器自動化:以程式設計方式導航網頁、點擊元素、填寫表單並與複雜的網頁 UI 元件進行互動。

  • 深度研究能力:自動進行多來源網頁搜尋、綜合研究結果並產生結構化的 Markdown 報告。

  • 技能管理系統:學習、保存並管理自定義的瀏覽器技能,實現跨工作階段的重複性與參數化工作流。

  • 持續性任務監控:使用內建的 HTTP 守護程序在背景執行任務,透過網頁儀表板即時檢視進度並擷取結果。

  • 可觀察性與日誌紀錄:獲得執行日誌、任務成功率與系統健康狀態的完整可見性,以提升可靠性與除錯能力。

  • 代理程式依賴於大型語言模型(如 Gemini、GPT-4o 或 Claude)來解釋自然語言指令並決定瀏覽器動作。

  • 請確保已透過環境變數或伺服器設定檔正確配置所選 LLM 提供商的 API 金鑰。

  • 使用無頭模式 (headless) 以提升效能,或將其關閉以即時觀察互動過程以便排解問題。

  • 伺服器透過瀏覽器設定檔管理支援持久登入與 Cookie,適用於需要驗證的研究任務。

  • 輸入通常包含任務描述、目標網址與參數約束,輸出則為結構化數據、研究報告或執行成功確認。

  • 此伺服器需要 Playwright 作為依賴項,並提供了自動安裝必要瀏覽器驅動程式的工具。

倉庫統計

Star 數
929
Fork 數
111
Open Issue 數
11
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月1日 上午09:15
在 GitHub 查看