工程開發
service-mesh-observability
為 Istio 和 Linkerd 服務網格實作生產級可觀測性,包含分佈式追蹤、指標儀表板及黃金信號監控。
簡介
服務網格可觀測性技能為微服務架構提供了一套全面的測量、監控與除錯框架。此技能專為使用 Istio 和 Linkerd 的平台工程師與 SRE 設計,涵蓋了業界標準的可觀測性模式。它能協助用戶克服分散式系統中的常見挑戰,例如不確定性延遲、間歇性網絡故障以及複雜的服務間通訊相依性。透過整合指標、追蹤與日誌這三大支柱,AI 代理能指導用戶建立強大的監控堆疊,以洞察網格內部的運行狀態。當您需要基於真實的黃金信號定義服務水準目標 (SLO)、排除連接瓶頸或視覺化服務間流量以識別效能衰退時,此技能將是最佳工具。
-
提供 Istio 與 Prometheus 及 Grafana 的完整實作模板,包含針對請求速率、錯誤率 (5xx) 及 P99 延遲分佈的自訂 PromQL 查詢。
-
提供 Jaeger 分佈式追蹤的深度整合指南,涵蓋採樣配置與 Zipkin 收集器部署。
-
內建 Linkerd Viz 工具集,用於即時流量檢測、基於路徑的指標分析及依賴關係繪製。
-
建立標準化的黃金信號儀表板框架,重點監控延遲、流量、錯誤率與資源飽和度。
-
支援定義告警閾值及針對網格工作負載的異常檢測配置。
-
需確保 Kubernetes 叢集已正確安裝並啟用服務網格 (Istio 或 Linkerd)。
-
輸入包含環境配置、命名空間與資源名稱;輸出包含 YAML 資訊清單、PromQL 表達式以及用於可觀測性工具的 CLI 指令序列。
-
適用於 kubectl、helm 以及各網格平台專屬的 CLI 工具。
-
遵循非侵入式監控的最佳實作,確保在維持資料高保真度的同時,將對服務效能的額外負擔降至最低。
倉庫統計
- Star 數
- 34,493
- Fork 數
- 3,737
- Open Issue 數
- 4
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年4月29日 上午06:18