工程開發
grafana-dashboards avatar

grafana-dashboards

建立與管理生產級 Grafana 儀表板,用於系統可觀測性、即時指標視覺化與監控。

簡介

此技能提供設計與管理 Grafana 儀表板的系統化框架,使工程師能深入了解基礎架構與應用程式效能。適用於需要實作生產級可觀測性解決方案的 DevOps 工程師、網站可靠性工程師 (SRE) 及開發人員。透過採用標準化方法,此技能確保儀表板不僅視覺呈現資訊豐富,且具備營運操作價值。

此技能涵蓋儀表板開發的完整生命週期,從初始設計原則到面板配置與資料來源整合。它遵循經驗證的可觀測性標準,如服務層級監控的 RED 方法 (速率、錯誤、持續時間) 以及資源管理的 USE 方法 (使用率、飽和度、錯誤)。使用者可輕鬆建立複雜面板,包含時間序列圖、統計面板、表格及熱圖,確保全面掌握系統健康狀態。

  • 包含資訊層級結構與指標分類的標準化設計原則。

  • 支援 RED 與 USE 方法等核心可觀測性框架的實作。

  • 提供 Prometheus 指標、查詢變數與儀表板模板的高級配置支援。

  • 內建 API 監控、基礎架構效能追蹤與 SLO (服務層級目標) 儀表板的現成模式。

  • 支援基於臨界值逾越或效能衰退的警報配置,並整合通知機制。

  • 需要有效的 Grafana 實例與配置好的資料來源,如 Prometheus 或 InfluxDB。

  • 適用於視覺化即時系統指標、業務 KPI 與基礎架構利用率。

  • 建議定義變數以進行多命名空間或多服務篩選,以確保儀表板的可擴展性。

  • 請遵循提供的 JSON 面板與模板架構以保持一致性並簡化部署流程。

  • 使用提供的佈建模式,透過 dashboards.yml 將儀表板管理整合至 CI/CD 流程中。

倉庫統計

Star 數
34,493
Fork 數
3,737
Open Issue 數
4
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月29日 上午06:24
在 GitHub 查看