工程开发
grafana-dashboards avatar

grafana-dashboards

建立与管理生产级 Grafana 仪表板,用于系统可观测性、实时指标可视化与监控。

简介

此技能提供设计与管理 Grafana 仪表板的系统化框架,使工程师能深入了解基础设施与应用程序性能。适用于需要实施生产级可观测性解决方案的 DevOps 工程师、网站可靠性工程师 (SRE) 及开发人员。通过采用标准化方法,此技能确保仪表板不仅视觉呈现信息丰富,且具备运营操作价值。

此技能涵盖仪表板开发的完整生命周期,从初始设计原则到面板配置与数据源集成。它遵循经验证的可观测性标准,如服务层级监控的 RED 方法 (速率、错误、持续时间) 以及资源管理的 USE 方法 (利用率、饱和度、错误)。用户可轻松构建复杂面板,包括时间序列图、统计面板、表格及热图,确保全面掌握系统健康状态。

  • 包含信息层级结构与指标分类的标准化设计原则。

  • 支持 RED 与 USE 方法等核心可观测性框架的实施。

  • 提供 Prometheus 指标、查询变量与仪表板模板的高级配置支持。

  • 内置 API 监控、基础设施性能追踪与 SLO (服务层级目标) 仪表板的现成模式。

  • 支持基于阈值逾越或性能衰退的警报配置,并集成通知机制。

  • 需要有效的 Grafana 实例与配置好的数据源,如 Prometheus 或 InfluxDB。

  • 适用于可视化实时系统指标、业务 KPI 与基础设施利用率。

  • 建议定义变量以进行多命名空间或多服务筛选,以确保仪表板的可扩展性。

  • 请遵循提供的 JSON 面板与模板架构以保持一致性并简化部署流程。

  • 使用提供的预置模式,通过 dashboards.yml 将仪表板管理集成至 CI/CD 流程中。

仓库统计

Star 数
34,493
Fork 数
3,737
Open Issue 数
4
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年4月29日 06:24
在 GitHub 查看
grafana-dashboards | Skills Hub