service-mesh-observability

簡介

服務網格可觀測性技能為微服務架構提供了一套全面的測量、監控與除錯框架。此技能專為使用 Istio 和 Linkerd 的平台工程師與 SRE 設計，涵蓋了業界標準的可觀測性模式。它能協助用戶克服分散式系統中的常見挑戰，例如不確定性延遲、間歇性網絡故障以及複雜的服務間通訊相依性。透過整合指標、追蹤與日誌這三大支柱，AI 代理能指導用戶建立強大的監控堆疊，以洞察網格內部的運行狀態。當您需要基於真實的黃金信號定義服務水準目標 (SLO)、排除連接瓶頸或視覺化服務間流量以識別效能衰退時，此技能將是最佳工具。

提供 Istio 與 Prometheus 及 Grafana 的完整實作模板，包含針對請求速率、錯誤率 (5xx) 及 P99 延遲分佈的自訂 PromQL 查詢。
提供 Jaeger 分佈式追蹤的深度整合指南，涵蓋採樣配置與 Zipkin 收集器部署。
內建 Linkerd Viz 工具集，用於即時流量檢測、基於路徑的指標分析及依賴關係繪製。
建立標準化的黃金信號儀表板框架，重點監控延遲、流量、錯誤率與資源飽和度。
支援定義告警閾值及針對網格工作負載的異常檢測配置。
需確保 Kubernetes 叢集已正確安裝並啟用服務網格 (Istio 或 Linkerd)。
輸入包含環境配置、命名空間與資源名稱；輸出包含 YAML 資訊清單、PromQL 表達式以及用於可觀測性工具的 CLI 指令序列。
適用於 kubectl、helm 以及各網格平台專屬的 CLI 工具。
遵循非侵入式監控的最佳實作，確保在維持資料高保真度的同時，將對服務效能的額外負擔降至最低。

創業課程

網上課程

實體課程

service-mesh-observability

簡介

倉庫統計