claude-copilot
分析 Markdown 文件以确保符合预定义的 AI Token 预算,并优化内容以利于 AI 高效摄取。
简介
Token Budget Check 技能是一款为使用大型语言模型 (LLM) 来索引、搜索或处理大型文档存储库的团队所设计的自动化维护工具。通过执行严格的 Token 限制,此技能可确保 Markdown 文件(如操作指南、代理配置文件和产品架构摘要)保持在优化的摄取范围内。它专为将文档集成到 AI 驱动工作流程的开发人员和技术作家所设计,可防止因上下文窗口饱和而导致的性能下降。
此技能通过扫描文件系统、根据路径模式或 Frontmatter 元数据推断文档类型,并使用标准化转换系数计算预估的 Token 数量。当文件超过指定的预算时,该技能会针对内容压缩提供具体且细化的建议。用户可利用此工具主动管理知识库,确保文档对人类开发人员和下游 AI 代理皆具备可读性,同时在 RAG (检索增强生成) 过程中维持成本效益与准确性。
-
根据字数(1.4 倍乘数)自动计算 Token 预估值,实现精确的预算监控。
-
支持各类文档类型的分类预算层级,例如 SKILL.md、架构摘要和操作指南。
-
识别内容优化模式,包括将冗长叙述转换为表格、缩短示例以及移除冗余标题。
-
与标准 CLI 工具(如 find、wc 和 bash)集成,可在本地开发环境与 CI/CD 管线中流畅运行。
-
生成结构化的 Token 预算报告,强调符合标准的文档、警告等级(80-100% 使用率)以及超出预算的违规项目。
-
在 AI 索引周期前,于项目根目录定期执行此技能以审核文档健康状态。
-
当文档被标记时,优先将密集的段落转换为表格或列表,以达到 30-50% 的 Token 缩减率。
-
工具通过模式匹配识别文件;请确保自定义文档路径与技能的触发配置一致。
-
输入通常为目录路径或特定的 Markdown 文件;输出为包含针对性改进建议的格式化 Markdown 摘要。
-
请注意此为预估工具;确切的 Token 数量可能会根据目标 LLM 的特定 Tokenizer 实现方式而略有差异。
仓库统计
- Star 数
- 13
- Fork 数
- 3
- Open Issue 数
- 3
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 17:03