生产力
feishu-fetch-doc avatar

feishu-fetch-doc

获取并解析飞书云文档为 Markdown,支持媒体内容处理与知识库链接解析。

简介

feishu-fetch-doc 技能使 AI 代理能够通过以结构化的 Markdown 格式提取云端文档内容,与飞书/Lark 生态系统无缝集成。专为依赖飞书进行文档管理与协作的开发者、研究人员及高级用户而设计,本工具填补了企业知识库与 AI 处理流程之间的鸿沟。它能自动化提取复杂的文档结构,包括文本、表格及内部块元素,同时提供处理二进制媒体(如图片、文件、画板)的专业协议。

  • 将飞书/Lark docx 内容转换为纯净、符合 Lark 格式的 Markdown,便于大型语言模型读取。

  • 完全兼容于飞书知识库 (Wiki) 导航,在提取前自动解析对象类型(如 docx、sheet、bitable)。

  • 与 feishu_doc_media 工具集成,利用唯一的资源标记 (resource token) 下载图片、附件与画板快照等二进制资产。

  • 支持直接使用 URL 或标记 (token) 来识别标准文档与复杂知识库 (Wiki) 条目。

  • 为多工具编排提供稳健的架构桥梁,允许代理以独立且高效的步骤获取文字与媒体内容。

  • 用户需提供 doc_id 或完整的飞书 URL;系统会自动提取 API 通信所需的标记。

  • 对于 Wiki 链接,请务必先使用 feishu_wiki_space_node 工具确定资源类型(例如 docx、sheet 或 bitable),以避免类型不匹配错误。

  • 图片、文件与画板会以 HTML 风格的占位符返回(例如 <image token=.../>);这些内容需要二次调用 feishu_doc_media 工具以进行本地存储与检索。

  • 请确保环境已配置适当的飞书集成权限,以访问指定的文档范围。

  • 本工具的最佳使用顺序为:先解析文档类型,接着获取主要内容,若输出包含媒体标签,最后再触发媒体下载流程。

仓库统计

Star 数
5,606
Fork 数
603
Open Issue 数
391
主要语言
TypeScript
默认分支
main
同步状态
空闲
最近同步时间
2026年5月1日 08:04
在 GitHub 查看