自动化
remote-browser avatar

remote-browser

从沙盒环境远程控制无头浏览器,进行自动化网页浏览、数据抓取、表单交互及测试工作。

简介

remote-browser 技能是一个强大的自动化工具包,专为在受限或无头环境(如云端虚拟机、持续集成 (CI) 流水线和编码代理)中运行的代理程序而设计。它弥合了沙盒计算资源与开放网络之间的差距,允许代理程序在无需直接图形界面的情况下可靠地执行复杂的基于浏览器的任务。通过利用 Chrome 开发者工具协议 (CDP),该技能可以实现对浏览器会话、标签页和页面元素的细粒度控制,非常适合开发人员和 AI 代理进行网页抓取、自动化测试或网站交互。

  • 全面的浏览器生命周期管理:通过终端指令或 Python API 直接启动、导航、刷新并终止无头 Chromium 会话。
  • 元素感知的交互:自动解析页面状态以公开可点击的索引,让代理程序执行精确的点击、输入、悬停和双击操作。
  • 综合数据提取:通过简单的诊断指令获取页面标题、完整 HTML 源代码、文本内容和元素属性。
  • 网络与会话支持:管理持久性 Cookie,处理多个浏览器标签页,并通过 Cloudflare 将本地开发服务器隧道传输至云端,以便于测试。
  • 灵活的执行方式:支持串联指令以执行类脚本操作,并提供集成的 Python 环境以在浏览器上下文中执行复杂逻辑。

使用此技能时,代理程序将扮演无头浏览器的角色,能够处理现代网络的复杂性。强烈建议在部署前执行 doctor 指令以验证环境兼容性。用户可以通过 CDP URL 连接到现有的 Chrome 实例,或使用内置的云端连接功能实现无缝扩展。该技能支持高级输入场景,包括文件上传、键盘序列模拟和基于坐标的点击。请注意,虽然该工具被设计为持久性的,但代理程序应确保使用 close 指令进行干净的会话管理,以防止在云端环境中资源泄漏。它与基于 Python 的代理程序原生集成,并支持在需要私有网页浏览时使用各种身份验证机制。

仓库统计

Star 数
91,320
Fork 数
10,399
Open Issue 数
239
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年4月30日 09:11
在 GitHub 查看