自動化
remote-browser avatar

remote-browser

從沙盒環境遠端控制無頭瀏覽器,進行自動化網頁瀏覽、資料擷取、表單互動及測試工作。

簡介

remote-browser 技能是一個強大的自動化工具包,專為在受限或無頭環境(如雲端虛擬機、持續整合 (CI) 流水線和編碼代理)中運行的代理程式而設計。它彌合了沙盒運算資源與開放網路之間的差距,允許代理程式在無需直接圖形介面的情況下可靠地執行複雜的基於瀏覽器的任務。透過利用 Chrome 開發者工具協議 (CDP),該技能可以實現對瀏覽器會話、標籤頁和頁面元素的細粒度控制,非常適合開發人員和 AI 代理進行網頁抓取、自動化測試或網站互動。

  • 全面的瀏覽器生命週期管理:透過終端指令或 Python API 直接啟動、導航、重新整理並終止無頭 Chromium 會話。
  • 元素感知的互動:自動解析頁面狀態以公開可點擊的索引,讓代理程式執行精確的點擊、輸入、懸停和雙擊操作。
  • 綜合資料提取:透過簡單的診斷指令獲取頁面標題、完整 HTML 原始碼、文字內容和元素屬性。
  • 網路與會話支援:管理持久性 Cookie,處理多個瀏覽器標籤頁,並透過 Cloudflare 將本機開發伺服器隧道傳輸至雲端,以便於測試。
  • 靈活的執行方式:支援串聯指令以執行類腳本操作,並提供整合的 Python 環境以在瀏覽器上下文中執行複雜邏輯。

使用此技能時,代理程式將扮演無頭瀏覽器的角色,能夠處理現代網路的複雜性。強烈建議在部署前執行 doctor 指令以驗證環境相容性。使用者可以透過 CDP URL 連接到現有的 Chrome 實例,或使用內建的雲端連接功能實現無縫擴展。該技能支援進階輸入場景,包括檔案上傳、鍵盤序列模擬和基於座標的點擊。請注意,雖然該工具被設計為持久性的,但代理程式應確保使用 close 指令進行乾淨的會話管理,以防止在雲端環境中資源洩漏。它與基於 Python 的代理程式原生整合,並支援在需要私有網頁瀏覽時使用各種身份驗證機制。

倉庫統計

Star 數
91,320
Fork 數
10,399
Open Issue 數
239
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月30日 上午09:11
在 GitHub 查看