自动化
browser-use
基于 Model Context Protocol 的 AI 浏览器自动化服务器,支持网页交互、数据提取与深度研究。
简介
此 MCP 服务器为 AI 助手提供了一个强大的网页浏览器控制接口,实现复杂的网页自动化与数据提取流程。通过将 browser-use 库封装于 HTTP 传输层,它解决了标准 stdio 通信中常见的超时问题,确保能够执行长达 30 到 120 秒以上的浏览器任务。它专为需要自动化交互、进行多来源研究或建立可重复使用浏览器工作流的开发者与高级用户而设计。
-
完整的浏览器自动化:以程序化方式导航网页、点击元素、填写表单并与复杂的网页 UI 组件进行交互。
-
深度研究能力:自动进行多来源网页搜索、综合研究结果并生成结构化的 Markdown 报告。
-
技能管理系统:学习、保存并管理自定义的浏览器技能,实现跨工作会话的重复性与参数化工作流。
-
持续性任务监控:使用内置的 HTTP 守护程序在后台执行任务,通过网页仪表板实时查看进度并提取结果。
-
可观测性与日志记录:获得执行日志、任务成功率与系统健康状态的完整可见性,以提升可靠性与调试能力。
-
代理程序依赖于大型语言模型(如 Gemini、GPT-4o 或 Claude)来解释自然语言指令并决定浏览器动作。
-
请确保已通过环境变量或服务器配置文件正确配置所选 LLM 提供商的 API 密钥。
-
使用无头模式 (headless) 以提升性能,或将其关闭以实时观察交互过程以便排查问题。
-
服务器通过浏览器配置文件管理支持持久登录与 Cookie,适用于需要验证的研究任务。
-
输入通常包含任务描述、目标网址与参数约束,输出则为结构化数据、研究报告或执行成功确认。
-
此服务器需要 Playwright 作为依赖项,并提供了自动安装必要浏览器驱动程序的工具。
仓库统计
- Star 数
- 929
- Fork 数
- 111
- Open Issue 数
- 11
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月1日 09:15