eval-harness
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 248 个技能
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
从业务背景识别并记录客户问题 (CP)。适用于开始需求工程或利益相关者仅描述解决方案而非问题时。这是 Problem-Based SRS 方法论的第 1 步。
生成与 IntelliJ coding-aider 插件兼容的结构化开发计划、检查清单及文件上下文。
使用 AgentDB 的超快速向量后端实现 ReasoningBank 自适应学习。具备轨迹追踪、判定评估、记忆蒸馏与模式识别功能,适用于构建自我学习的自主智能体。
一套基于阶段驱动的AI写作工作流,专为结构化、可重复、可追溯的深度长文创作而设计,强调人机协作与流程控制。
通过 MCP 将您的 AI 代理连接至 Hugging Face Hub。搜索模型、数据集与论文,管理存储库,执行云端计算任务,并将 Gradio Spaces 作为 AI 工具调用使用。
设计冲刺与产品策略的问题框架工具。支持个人或团队协作,协助在进入解决方案开发前,系统化地定义目标、利益相关者、限制条件与痛点。
生成结构化的 Handoff Pack 提示词,用于将任务委派给 Gemini,确保明确的范围、验收标准与格式规范。
生成专业的股票研究报告,整合分析师共识预测、公司基本面、历史股价与宏观经济指标,协助构建投资论点。
设计与构建高质量 AI Agent Skills 的专家顾问。通过发现、架构与制作阶段的结构化引导,确保您建立的技能具备高度一致性、可组合性与执行效能。
根据自然语言描述生成优化后的 SQL 查询。支持 BigQuery、PostgreSQL、MySQL 与 Snowflake 等多种数据库方言。分析数据库架构、解读业务需求,并输出包含详细说明的可执行查询。
一套管理 LLM 项目生命周期的框架,涵盖评估任务模型契合度、架构设计、结构化输出解析及代理辅助开发流程。