import-content
手动将 Markdown 文件导入 Kurt 数据库、修复摄取错误,并通过本地文件系统同步管理文档元数据。
简介
import-content 技能是 Kurt 内容流水线中关键的手动补救与操作工具。它专为需要绕过自动 Web 摄取失败的技术用户而设计,通过直接将预处理过的 Markdown 文件从本地源目录导入 Kurt SQLite 数据库。即使在 WebFetch 或自动化钩子遇到网络问题或解析失败时,也能确保内容同步。它连接了原始本地文件与下游工作流程(如内容撰写技能)所需的数据库索引内容,并通过 YAML Frontmatter 确保高质量的元数据提取。
-
修复 Kurt 数据库中的 ERROR 记录,将其链接至修正后的本地 Markdown 源文件。
-
通过 Shell 脚本为大型数据集、迁移或备份恢复执行批量导入。
-
自动从 YAML Frontmatter 提取元数据,支持 title、description、author 及 published_date 等字段。
-
与 PostToolUse 钩子集成,监控 /sources/ 目录,并在手动编辑后自动更新文档记录。
-
支持针对原始爬虫未捕获的手动创建文件进行精确索引。
-
请确保所有 Markdown 文件顶部包含有效的 YAML Frontmatter,以正确填充数据库架构。
-
在批量恢复操作中,使用 .claude/scripts/ 下提供的 Python 脚本链接文档 ID 与本地路径。
-
进行手动摄取后,请务必执行 kurt index 指令,以触发新导入内容的文档智能处理流水线。
-
此工具严格限制在本地源路径内的文件;请确保文件权限允许代理访问源文件。
-
若缺少 pyyaml 库,元数据提取将会静默失败;请确保通过 pip install kurt-core 完成 Kurt 环境的完整初始化。
-
此工具旨在进行高级内容管理与恢复;执行批量操作后,务必使用 kurt content list 确认数据库状态。
仓库统计
- Star 数
- 2
- Fork 数
- 0
- Open Issue 数
- 0
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 20:27