工程开发
claude-copilot avatar

claude-copilot

分析 Markdown 文件以确保符合预定义的 AI Token 预算,并优化内容以利于 AI 高效摄取。

简介

Token Budget Check 技能是一款为使用大型语言模型 (LLM) 来索引、搜索或处理大型文档存储库的团队所设计的自动化维护工具。通过执行严格的 Token 限制,此技能可确保 Markdown 文件(如操作指南、代理配置文件和产品架构摘要)保持在优化的摄取范围内。它专为将文档集成到 AI 驱动工作流程的开发人员和技术作家所设计,可防止因上下文窗口饱和而导致的性能下降。

此技能通过扫描文件系统、根据路径模式或 Frontmatter 元数据推断文档类型,并使用标准化转换系数计算预估的 Token 数量。当文件超过指定的预算时,该技能会针对内容压缩提供具体且细化的建议。用户可利用此工具主动管理知识库,确保文档对人类开发人员和下游 AI 代理皆具备可读性,同时在 RAG (检索增强生成) 过程中维持成本效益与准确性。

  • 根据字数(1.4 倍乘数)自动计算 Token 预估值,实现精确的预算监控。

  • 支持各类文档类型的分类预算层级,例如 SKILL.md、架构摘要和操作指南。

  • 识别内容优化模式,包括将冗长叙述转换为表格、缩短示例以及移除冗余标题。

  • 与标准 CLI 工具(如 find、wc 和 bash)集成,可在本地开发环境与 CI/CD 管线中流畅运行。

  • 生成结构化的 Token 预算报告,强调符合标准的文档、警告等级(80-100% 使用率)以及超出预算的违规项目。

  • 在 AI 索引周期前,于项目根目录定期执行此技能以审核文档健康状态。

  • 当文档被标记时,优先将密集的段落转换为表格或列表,以达到 30-50% 的 Token 缩减率。

  • 工具通过模式匹配识别文件;请确保自定义文档路径与技能的触发配置一致。

  • 输入通常为目录路径或特定的 Markdown 文件;输出为包含针对性改进建议的格式化 Markdown 摘要。

  • 请注意此为预估工具;确切的 Token 数量可能会根据目标 LLM 的特定 Tokenizer 实现方式而略有差异。

仓库统计

Star 数
13
Fork 数
3
Open Issue 数
3
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年5月3日 17:03
在 GitHub 查看