工程開發
service-mesh-observability avatar

service-mesh-observability

為 Istio 和 Linkerd 服務網格實作專業的可觀測性模式,包含分散式追蹤、Prometheus 指標、Grafana 儀表板及自動化服務水準目標 (SLO) 監控。

簡介

service-mesh-observability 技能為負責維護複雜微服務架構可視性的 SRE 和 DevOps 工程師提供了一套完整的工具。透過對指標、追蹤和日誌這三大可觀測性支柱的標準化,此技能確保 Istio 和 Linkerd 的部署具有彈性、高效能且易於除錯。它協助團隊從反應式事故管理轉向主動式的效能調整與容量規劃。

  • 進階指標與警報:針對四大黃金訊號(延遲、流量、錯誤與飽和度)的預先配置查詢,可在問題影響使用者前偵測異常。

  • 分散式追蹤整合:實作 Jaeger 以跨越網格邊界追蹤請求的詳細模式,精準定位多跳服務呼叫中的效能瓶頸。

  • 儀表板與視覺化:包含 Grafana 的範本配置,用於監控服務拓撲中的請求率、錯誤代碼及 P99 延遲分佈。

  • 服務通訊 SLO:定義與追蹤服務水準目標的框架,確保符合內部效能與可用性標準。

  • 網格連線疑難排解:利用 Linkerd Viz 等工具檢查即時流量、分析路徑指標並視覺化相依性邊緣的專業指令與技術。

  • 適合管理 Kubernetes 服務網格的 SRE、平台工程師與後端開發人員使用。

  • 需要預先安裝 Istio 或 Linkerd 控制平面;與 Prometheus Operator 及標準可觀測性技術堆疊相容。

  • 輸入包括基礎架構配置與監控目標;輸出為監控範本、警報規則及 PromQL 指標分析。

  • 請根據流量規模調整分散式追蹤的採樣率,以在細緻度、儲存成本與效能負擔之間取得平衡。

倉庫統計

Star 數
34,454
Fork 數
3,734
Open Issue 數
3
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月28日 上午11:53
在 GitHub 查看