工程开发自动化
k8s-troubleshooter
系统化 Kubernetes 故障排查、Pod 诊断、集群健康监控与事故响应指南。
浏览: 11★ 139
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 141 个技能
系统化 Kubernetes 故障排查、Pod 诊断、集群健康监控与事故响应指南。
从事件日志生成安全事件响应时间轴与结构化报告,用于高效跟踪从检测到恢复的全过程。
DevOps 与平台工程模式:Kubernetes、Terraform、GitOps、CI/CD、可观测性、事件响应及云原生运营。
NanoClaw WhatsApp 机器人的安全咨询监控,通过 MCP 工具提供漏洞扫描、技能安全检查与完整性保护。
适用于 Vercel 托管项目的紧急恢复工具。管理部署回滚、数据库迁移还原、缓存清除及健康状态验证流程。
基于 CLI 的交互式问题管理系统,提供完整的 CRUD 功能以跟踪、规划并执行开发任务。
利用风险评估与优先级排序,将测试重点集中在最高风险区域。适用于规划测试策略、配置测试资源或进行覆盖率决策。
维护结构化的 DEBUG_LOG.md 以记录程序错误、调试过程与解决方案,确保项目稳定性并积累技术知识。
生产级监控系统,包含 Prometheus 指标、Grafana 仪表板、PromQL 查询语言、告警规则与 AI 异常检测,适用于云原生应用。
一套严格的四阶段方法论,强制要求在应用任何代码修复前,必须先进行系统性的根本原因分析。
一个 AI 驱动的测试运营平台与 MCP 服务器,提供自动化测试失败分析、根因匹配 (RCA) 及 CI/CD 流水线的智能测试编排。
强制执行严格的实证调试工作流程,利用结构化观察、假设检验和因果验证,消除技术调查中的推测。