docx
专业 .docx 文档工具,提供文档创建、编辑与分析功能。支持修订追踪、留言、格式保留、Metadata 处理及 OOXML 底层存取。
简介
docx 技能为 Claude Code 提供了管理专业 Word 文档的结构化框架。专为需要对复杂文档格式进行程序化控制的工程师、法律专业人员及技术作者设计。通过将 OOXML (Open Office XML) 的复杂性抽象化为清晰的工作流程,此技能支持精确的文档操作,并确保格式与元数据的完整性。
-
文字提取与分析:使用 pandoc 将 .docx 转换为结构化 Markdown,在保留修订追踪痕迹的同时,实现快速内容审阅。
-
OOXML 底层存取:通过解包文档为 XML 组件 (document.xml, comments.xml) 来实现深度编辑,支持媒体、样式及高级结构的精细化调整。
-
自动化创建:利用 docx-js 整合,通过程序化定义从零开始生成新文档,确保模板应用的一致性。
-
专业红线审阅 (Redlining):针对法律与商业文档实施系统化的红线审阅工作流。采用批次处理策略(每批 3-10 次变更),使用 <w:ins> 与 <w:del> 标签确保精确的插入与删除,同时维护文档原始 RSID 的完整性。
-
格式保留:使用专用的 Python 脚本进行文档打包与解包,确保自动化编辑与最终导出之间的结构完整性。
-
使用说明:对于简单的文字更新,请使用 pandoc 提取流程。对于高风险文档修改(如合约更新或复杂技术报告),请务必遵循红线审阅流程,以防止文档损坏。
-
系统依赖:确保系统已安装 pandoc、用于 OOXML 脚本的 Python 环境,以及用于 docx-js 输出的 JavaScript 环境。
-
实作建议:在进行复杂修改前,请务必完整阅读参考文档 (ooxml.md 与 docx-js.md)。请使用特定的结构标识符(例如章节编号或唯一标记)而非行号,因为 Markdown 表示法无法对应至 XML 结构。
-
限制:此工具专为专业 OOXML (.docx) 文件设计,不适用于旧版二进制 (.doc) 格式。在对生产环境文档应用自动化脚本前,请务必建立备份。
仓库统计
- Star 数
- 2,839
- Fork 数
- 329
- Open Issue 数
- 7
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年4月29日 14:39