工程開發
context-compression avatar

context-compression

透過先進的上下文壓縮、結構化摘要與任務導向的狀態管理,為長期運行的 AI 代理會話優化效能並降低 Token 使用量。

簡介

此技能專為管理複雜、長期運行會話的開發人員與 AI 代理所設計,特別是在上下文視窗接近極限時。在處理包含超過 500 萬個 Token 的大型代碼庫時,簡單地截斷歷史記錄會導致代理遺忘關鍵資訊,如檔案修改、函數簽章與錯誤日誌。本技能實施先進的上下文壓縮策略,將「單一任務消耗 Token 數」(tokens-per-task) 作為指標,而非僅考慮單次請求的節省量。透過關注整體任務效率,能有效避免因壓縮不當導致頻繁重新獲取資訊所造成的成本浪費。

  • 錨定迭代摘要:維護結構化的持續性摘要,追蹤會話意圖、特定檔案變更、設計決策與未完成任務,確保專案狀態不丟失。

  • 結構化產物追蹤:提供機制記錄哪些檔案被修改、讀取或建立,緩解編碼代理中常見的「產物追蹤」問題。

  • 壓縮觸發啟發式:提供多種策略,如固定閾值觸發、滑動視窗與重要性排序減量,以決定壓縮歷史記錄的最佳時機。

  • 基於探針的品質評估:整合評估框架,透過檢測事實回憶、決策推理與產物完整性,衡量壓縮品質,超越單純的詞彙匹配。

  • 單一任務 Token 優化:將重點從最小化輸入 Token 轉移到最小化整體成本與延遲,透過減少代理在複雜編碼工作中的重複探索或幻覺,提升執行效率。

  • 當遇到上下文視窗溢出或代理在長期多輪編碼任務中表現下降時,請啟用此技能。

  • 利用提供的結構化 Markdown 段落,強制保存如 JWT 設定、Redis 連線池與錯誤訊息歷史等技術細節。

  • 實作依賴於對會話歷史進行邏輯分段,防止在多次壓縮循環中發生關鍵資訊漂移。

  • 適用於使用 XState 或標準 CLI 代理架構的系統,其中明確的狀態與歷史記錄對於高精度輸出至關重要。

  • 建議使用者確保其評估協議包含特定的「探針問題」,以驗證必要檔案路徑與系統限制在壓縮過程中得以保留。

倉庫統計

Star 數
0
Fork 數
1
Open Issue 數
1
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月3日 下午09:30
在 GitHub 查看