工程开发
data-extraction-patterns avatar

data-extraction-patterns

提供 GA4 和 GSC 分析数据提取、缓存及处理的最佳实践模式,支持 MCP 服务器集成。

简介

本技能为负责分析数据工程的软件代理提供了一套全面的操作模式库。它专注于通过 MCP 服务器集成,从 Google Analytics 4 (GA4) 和 Google Search Console (GSC) 标准化提取指标与维度。此工具集专为构建自动化报表管道的数据工程师与开发者设计,确保数据获取的一致性、性能优化及 API 可靠性。用户可以利用这些模式构建弹性的数据收集工作流,以处理常见挑战,如速率限制、网络波动及高频数据请求。

  • 针对 GA4 get_report 和 GSC search_analytics 查询提供标准化操作,简化报表生成流程。

  • 内置高频指标缓存策略,以最小化 API 成本并提升响应速度。

  • 采用并行执行模式以优化来自多个来源的数据获取,可将总执行时间缩短至 50%。

  • 提供强健的重试机制与指数退避算法,用于处理大规模数据获取期间遇到的 429 速率限制错误。

  • 提供关键 SEO 指标(如点击次数、展示次数、点击率、排名、会话、跳出率)的完整参考,方便快速进行数据洞察映射。

  • 提供模块化基于会话的缓存管理,确保数据新鲜度同时维持严格的 TTL (生存时间) 策略。

  • 在构建自动化 SEO 监控仪表板或将营销数据汇总到数据仓库时,请集成这些模式。

  • 在处理延迟敏感的多属性审计时,请利用并行获取逻辑。

  • 请务必定义明确的日期范围与维度参数,以避免 API 调用中的采样问题或过多的行数。

  • 使用所提供的 Bash 工具模式进行本地文件系统缓存,以减少对外部 API 正常运行时间的依赖。

  • 请注意,尽管此技能针对 GA4 和 GSC 进行了优化,但通过镜像建议的错误处理与速率限制结构,其逻辑同样可应用于其他基于 REST 的报表 API。

仓库统计

Star 数
255
Fork 数
31
Open Issue 数
7
主要语言
TypeScript
默认分支
main
同步状态
空闲
最近同步时间
2026年4月29日 13:50
在 GitHub 查看