工程開發
ring:testing-skills-with-subagents avatar

ring:testing-skills-with-subagents

用於構建健壯 AI Agent 技能的元技能,採用測試驅動開發 (TDD) 方法:定義失敗 (RED)、實作技能 (GREEN) 並修補合理化漏洞 (REFACTOR)。

簡介

testing-skills-with-subagents 技能為開發人員和 AI 工程師提供了一個嚴謹、以流程為導向的框架,用於創建、驗證和強化 Agent 技能。該技能直接借鑒了測試驅動開發 (TDD) 週期,將流程文檔視為必須根據 Agent 行為進行驗證的軟體。其核心理念是,只有在應用糾正技能之前,透過在受控環境中觀察 Agent 的失敗模式,才能證明其真實的合規性。

  • 專門為 AI 提示詞工程和行為合規性實作 RED-GREEN-REFACTOR 週期。

  • 促進壓力場景的創建——這些場景是真實且高風險的任務,旨在迫使 Agent 進入常見的反模式,例如繞過測試或將品質捷徑合理化。

  • 提供一種結構化方法來識別和記錄「合理化表格」,即 Agent 用來規避規則的逐字藉口,然後利用這些藉口建立嚴密的邏輯。

  • 專為複雜的工程工作流程而設計,在這些流程中,執行紀律(如 TDD、安全審查或法規遵從)至關重要且容易出現類似人類的迴避行為。

  • 當開發 Agent 可能因為時間限制、疲勞或所謂的實用主義而繞過的新指令、系統提示詞或行為準則時,請使用此技能。

  • 需要熟悉 ring:test-driven-development 作為先決條件,以確保迭代週期的一致應用。

  • 非常適合建構高可靠性的 Agent 系統,其中強制要求始終遵守標準(例如 API 文檔使用、編碼模式或合規協議)。

  • 預期的產出包括系統性地累積「紅旗」和相應的對策,確保技能在應對不斷變化的 Agent 行為時保持長期穩定。

  • 輸入要求包括明確定義的行為目標以及一組模擬真實生產環境的壓力測試場景。

倉庫統計

Star 數
181
Fork 數
20
Open Issue 數
7
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月30日 上午10:09
在 GitHub 查看