claude-copilot
分析 Markdown 文件以確保符合預先定義的 AI Token 預算,並優化內容以利於 AI 高效攝取。
簡介
Token Budget Check 技能是一款為使用大型語言模型 (LLM) 來索引、搜尋或處理大型文件儲存庫的團隊所設計的自動化維護工具。透過執行嚴格的 Token 限制,此技能可確保 Markdown 文件(如操作指南、代理設定檔和產品架構摘要)保持在優化的攝取範圍內。它專為將文件整合到 AI 驅動工作流程的開發人員和技術作家所設計,可防止因上下文窗口飽和而導致的效能下降。
此技能透過掃描檔案系統、根據路徑模式或 Frontmatter 元資料推斷文件類型,並使用標準化轉換係數計算預估的 Token 數量。當檔案超過指定的預算時,該技能會針對內容壓縮提供具體且細化的建議。使用者可利用此工具主動管理知識庫,確保文件對人類開發人員和下游 AI 代理皆具備可讀性,同時在 RAG (檢索增強生成) 過程中維持成本效益與準確性。
-
根據字數(1.4 倍乘數)自動計算 Token 預估值,實現精確的預算監控。
-
支援各類文件類型的分類預算層級,例如 SKILL.md、架構摘要和操作指南。
-
識別內容優化模式,包括將冗長敘述轉換為表格、縮短範例以及移除冗餘標題。
-
與標準 CLI 工具(如 find、wc 和 bash)整合,可在本地開發環境與 CI/CD 管線中流暢運作。
-
產生結構化的 Token 預算報告,強調符合標準的檔案、警告等級(80-100% 使用率)以及超出預算的違規項目。
-
在 AI 索引週期前,於專案根目錄定期執行此技能以審核文件健康狀態。
-
當文件被標記時,優先將密集的段落轉換為表格或清單,以達到 30-50% 的 Token 縮減率。
-
工具透過模式比對識別檔案;請確保自定義文件路徑與技能的觸發配置一致。
-
輸入通常為目錄路徑或特定的 Markdown 檔案;輸出為包含針對性改進建議的格式化 Markdown 摘要。
-
請注意此為預估工具;確切的 Token 數量可能會根據目標 LLM 的特定 Tokenizer 實作方式而略有差異。
倉庫統計
- Star 數
- 13
- Fork 數
- 3
- Open Issue 數
- 3
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年5月3日 下午05:03