工程开发
file-search avatar

file-search

快速的 codebase 搜索工具,整合 ripgrep 与 ast-grep,支持语法感知的结构化搜索。适用于代码库导航、影响分析与安全性审计。

简介

file-search 技能是一款高性能工具,专为开发者与 AI 代理设计,用于导航、审计与分析复杂的代码库。通过整合基于文本模式的搜索与语法感知的结构化匹配,显著缩短了寻找程序入口点、识别使用模式或检测安全性漏洞的时间。此技能建立在 ripgrep 与 ast-grep 等高性能引擎之上,这些引擎针对大规模项目的索引与检索进行了优化,性能远超传统的 grep 或 find 指令。

  • 使用 ripgrep (rg) 进行超高速的文本搜索,涵盖变量名称、字符串、注释以及多文件与目录中的正则表达式比对。

  • 利用 ast-grep (sg) 执行进阶的语法感知结构化搜索,通过比对抽象语法树 (AST) 来寻找函数签名、类定义或复杂代码块,而不受格式化差异影响。

  • 支持快速代码发现,例如在安全性审计期间寻找 TODO、FIXME、特定的 API 调用或硬编码的敏感凭证。

  • 强化重构工作流,在进行结构性变更前,精确定位对特定类、方法或依赖项的所有交叉引用。

  • 支持大规模代码分析,通过语言特定标记、排除目录的 glob 模式以及目录层级的范围设定,确保结果的高度相关性。

  • 实作专业搜索工作流,例如计算匹配数量、将输出通过管道导向 head 进行取样检查,以及使用边界限制 (word boundaries) 来确保精确匹配。

  • 请务必以目标明确、缩小范围的方式开始搜索,以避免淹没上下文窗口并造成 token 浪费。

  • 推荐使用渐进式精炼工作流:先确定一般范围,接着通过文件类型(例如 --type py, --lang js)与目录进行过滤,最后再套用复杂的正则表达式或结构化模式。

  • 进行复杂重构时,请优先使用 ast-grep 的语义感知能力,而非仅依赖文本搜索,以确保匹配的代码具备实际的语义关联性。

  • 时刻注意 token 消耗;在请求完整内容前,应先将大型结果集导向 head 或进行计数,以验证搜索密度。

  • 确保环境隔离;此技能专门针对 MassGen 执行框架进行了优化,并利用容器环境中预先配置的二进制工具。

仓库统计

Star 数
966
Fork 数
151
Open Issue 数
6
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年4月28日 11:01
在 GitHub 查看