工程开发
ring:testing-skills-with-subagents avatar

ring:testing-skills-with-subagents

用于构建健壮 AI Agent 技能的元技能,采用测试驱动开发 (TDD) 方法:定义失败 (RED)、实现技能 (GREEN) 并修补合理化漏洞 (REFACTOR)。

简介

testing-skills-with-subagents 技能为开发人员和 AI 工程师提供了一个严谨、以流程为导向的框架,用于创建、验证和强化 Agent 技能。该技能直接借鉴了测试驱动开发 (TDD) 周期,将流程文档视为必须根据 Agent 行为进行验证的软件。其核心理念是,只有在应用纠正技能之前,通过在受控环境中观察 Agent 的失败模式,才能证明其真实的合规性。

  • 专门为 AI 提示词工程和行为合规性实现 RED-GREEN-REFACTOR 周期。

  • 促进压力场景的创建——这些场景是真实且高风险的任务,旨在迫使 Agent 进入常见的反模式,例如绕过测试或将质量捷径合理化。

  • 提供一种结构化方法来识别和记录“合理化表格”,即 Agent 用来规避规则的逐字借口,然后利用这些借口建立严密的逻辑。

  • 专为复杂的工程工作流程而设计,在这些流程中,执行纪律(如 TDD、安全审查或法规遵从)至关重要且容易出现类似人类的规避行为。

  • 当开发 Agent 可能因为时间限制、疲劳或所谓的实用主义而绕过的新指令、系统提示词或行为准则时,请使用此技能。

  • 需要熟悉 ring:test-driven-development 作为先决条件,以确保迭代周期的一致应用。

  • 非常适合构建高可靠性的 Agent 系统,其中强制要求始终遵守标准(例如 API 文档使用、编码模式或合规协议)。

  • 预期的产出包括系统性地积累“红旗”和相应的对策,确保技能在应对不断变化的 Agent 行为时保持长期稳定。

  • 输入要求包括明确定义的行为目标以及一组模拟真实生产环境的压力测试场景。

仓库统计

Star 数
181
Fork 数
20
Open Issue 数
7
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年4月30日 10:09
在 GitHub 查看