工程開發
service-mesh-observability
為 Istio 和 Linkerd 服務網格實作專業的可觀測性模式,包含分散式追蹤、Prometheus 指標、Grafana 儀表板及自動化服務水準目標 (SLO) 監控。
簡介
service-mesh-observability 技能為負責維護複雜微服務架構可視性的 SRE 和 DevOps 工程師提供了一套完整的工具。透過對指標、追蹤和日誌這三大可觀測性支柱的標準化,此技能確保 Istio 和 Linkerd 的部署具有彈性、高效能且易於除錯。它協助團隊從反應式事故管理轉向主動式的效能調整與容量規劃。
-
進階指標與警報:針對四大黃金訊號(延遲、流量、錯誤與飽和度)的預先配置查詢,可在問題影響使用者前偵測異常。
-
分散式追蹤整合:實作 Jaeger 以跨越網格邊界追蹤請求的詳細模式,精準定位多跳服務呼叫中的效能瓶頸。
-
儀表板與視覺化:包含 Grafana 的範本配置,用於監控服務拓撲中的請求率、錯誤代碼及 P99 延遲分佈。
-
服務通訊 SLO:定義與追蹤服務水準目標的框架,確保符合內部效能與可用性標準。
-
網格連線疑難排解:利用 Linkerd Viz 等工具檢查即時流量、分析路徑指標並視覺化相依性邊緣的專業指令與技術。
-
適合管理 Kubernetes 服務網格的 SRE、平台工程師與後端開發人員使用。
-
需要預先安裝 Istio 或 Linkerd 控制平面;與 Prometheus Operator 及標準可觀測性技術堆疊相容。
-
輸入包括基礎架構配置與監控目標;輸出為監控範本、警報規則及 PromQL 指標分析。
-
請根據流量規模調整分散式追蹤的採樣率,以在細緻度、儲存成本與效能負擔之間取得平衡。
倉庫統計
- Star 數
- 34,454
- Fork 數
- 3,734
- Open Issue 數
- 3
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年4月28日 上午11:53