研究
gdoc avatar

gdoc

使用 curl 从公开分享的 Google 文档中可靠地读取并提取内容,确保获取完整文件。

简介

gdoc 技能是一种专门为在 SafeClaw 环境中运行的软件代理程序所设计的工具,用于可靠地获取公开 Google 文档的完整文本内容。通过绕过通常会截断或总结内容的标准网页抓取工具,此技能利用底层网络请求来确保整个文档结构保持完整,以进行分析、摘要或数据提取任务。它是专门为数据完整性至关重要的研究、内容整合和文档工作流程所构建的。

  • 通过将标准编辑后缀替换为 mobilebasic 视图,将 Google 文档网址转换为适合纯文本阅读的格式。

  • 使用 curl 命令行工具执行直接的 HTTP GET 请求,确保在容器化环境中的最大兼容性和可靠性。

  • 将文档输出直接重定向至临时文件,从而实现与本地读取工具及后续处理工作流程的无缝整合。

  • 促进从共享知识库、公共研究论文和协作草稿中进行自动化信息检索,无需手动复制粘贴。

  • 使用此技能前,请确保文档已在 Google 云端硬盘中设置为“知道链接的任何人”皆可访问。

  • 此技能明确要求使用 curl 而非 WebFetch 等工具,以避免现代网页爬虫库常见的数据截断问题。

  • 预期的工作流程涉及两个步骤:首先将文档下载至临时存储路径,接着触发本地文件阅读器来解析提取出的文本。

  • 用户应注意此工具严格为只读,并需要一个以 /edit 或类似后缀结尾的有效网址路径,才能正确映射至 mobilebasic 端点。

  • 适用于沙盒开发环境中的自动化研究代理、文档收集器以及并行化的信息整合任务。

仓库统计

Star 数
149
Fork 数
17
Open Issue 数
0
主要语言
HTML
默认分支
main
同步状态
空闲
最近同步时间
2026年5月3日 09:20
在 GitHub 查看