工程開發
data-extraction-patterns avatar

data-extraction-patterns

為 GA4 與 GSC 分析數據提供提取、緩存與處理的最佳實踐模式,並整合 MCP 伺服器操作。

簡介

本技能為負責分析數據工程的軟體代理提供了一套全面的操作模式庫。它專注於透過 MCP 伺服器整合,從 Google Analytics 4 (GA4) 與 Google Search Console (GSC) 標準化提取指標與維度。此工具集專為建立自動化報表管線的數據工程師與開發人員所設計,確保數據擷取的一致性、效能優化與 API 可靠性。使用者可以利用這些模式建立彈性的數據收集工作流程,以處理常見挑戰,如速率限制、網路波動與高頻數據請求。

  • 針對 GA4 get_report 與 GSC search_analytics 查詢提供標準化操作,簡化報表生成流程。

  • 內建高頻指標緩存策略,以最小化 API 成本並提升回應速度。

  • 採用平行執行模式以優化來自多個來源的數據擷取,可將總執行時間縮短至 50%。

  • 提供強健的重試機制與指數退避演算法,用於處理大規模數據擷取期間遇到的 429 速率限制錯誤。

  • 提供關鍵 SEO 指標(如點擊次數、曝光次數、點擊率、排名、工作階段、跳出率)的完整參考,方便快速進行數據洞察映射。

  • 提供模組化基於工作階段的緩存管理,確保數據新鮮度同時維持嚴格的 TTL (存活時間) 政策。

  • 在建立自動化 SEO 監控儀表板或將行銷數據整合至數據倉儲時,請整合這些模式。

  • 在處理延遲敏感的多屬性稽核時,請利用平行擷取邏輯。

  • 請務必定義明確的日期範圍與維度參數,以避免 API 呼叫中的取樣問題或過多的列數。

  • 使用所提供的 Bash 工具模式進行本地檔案系統緩存,以減少對外部 API 正常運作時間的依賴。

  • 請注意,儘管此技能針對 GA4 與 GSC 進行了優化,但透過鏡像建議的錯誤處理與速率限制結構,其邏輯同樣可應用於其他基於 REST 的報表 API。

倉庫統計

Star 數
255
Fork 數
31
Open Issue 數
7
主要語言
TypeScript
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月29日 下午01:50
在 GitHub 查看