google-search
使用真实 Chrome 浏览器进行 JavaScript 渲染的高级 Google 搜索。适用于抓取完整网页内容、指定网站搜索及时间筛选结果。
简介
google-search 技能通过 chromux CLI 调用真实的无头 Chrome 实例,提供高保真的网页检索界面。与基于 API 的标准网页搜索不同,该工具能执行 JavaScript,从而呈现现代复杂网页并绕过常规爬虫拦截机制。它专为需要可靠、拟人化网页数据访问的开发人员、研究人员和技术代理而设计。无论您是需要提取完整文章内容、从开发论坛抓取评论,还是进行深度的指定网站索引,此技能都能提供必要的浏览会话控制。当传统搜索 API 提供的摘要不足,或者必须通过动态内容渲染才能获取数据时,这是您的首选。
-
完整的 Chrome 渲染引擎:执行 JS 以获取网页在浏览器中看到的实际内容。
-
进阶过滤功能:支持 Google 搜索运算符(如 site:),以及针对日、周、月、年的时间筛选。
-
数据提取:专门支持提取文章正文、作者元数据、标签和评论区。
-
结构化输出:提供人类可读的文字摘要以及用于编程集成的原始 JSON 格式。
-
灵活的丰富化模式:可选的 --no-enrich 标志,让您在快速摘要模式与深度页面解析模式之间自由切换。
-
适用于需要获取全文内容以进行 RAG(检索增强生成)管道的深度研究任务。
-
非常适合搜索特定领域的文档或编程平台,如 dev.to、stackoverflow.com 或 GitHub 讨论。
-
要求预先安装 chromux CLI 并运行无头 Chrome 实例以获得最佳性能。
-
请注意丰富化处理的延迟;对于快速查询任务,建议使用 --no-enrich 标志以节省时间和系统资源。
-
通过直接将运算符注入 Google 搜索请求,高效处理指定网站的搜索查询。
仓库统计
- Star 数
- 152
- Fork 数
- 20
- Open Issue 数
- 1
- 主要语言
- Shell
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月1日 09:22