工程开发
import-content avatar

import-content

手动将 Markdown 文件导入 Kurt 数据库、修复摄取错误,并通过本地文件系统同步管理文档元数据。

简介

import-content 技能是 Kurt 内容流水线中关键的手动补救与操作工具。它专为需要绕过自动 Web 摄取失败的技术用户而设计,通过直接将预处理过的 Markdown 文件从本地源目录导入 Kurt SQLite 数据库。即使在 WebFetch 或自动化钩子遇到网络问题或解析失败时,也能确保内容同步。它连接了原始本地文件与下游工作流程(如内容撰写技能)所需的数据库索引内容,并通过 YAML Frontmatter 确保高质量的元数据提取。

  • 修复 Kurt 数据库中的 ERROR 记录,将其链接至修正后的本地 Markdown 源文件。

  • 通过 Shell 脚本为大型数据集、迁移或备份恢复执行批量导入。

  • 自动从 YAML Frontmatter 提取元数据,支持 title、description、author 及 published_date 等字段。

  • 与 PostToolUse 钩子集成,监控 /sources/ 目录,并在手动编辑后自动更新文档记录。

  • 支持针对原始爬虫未捕获的手动创建文件进行精确索引。

  • 请确保所有 Markdown 文件顶部包含有效的 YAML Frontmatter,以正确填充数据库架构。

  • 在批量恢复操作中,使用 .claude/scripts/ 下提供的 Python 脚本链接文档 ID 与本地路径。

  • 进行手动摄取后,请务必执行 kurt index 指令,以触发新导入内容的文档智能处理流水线。

  • 此工具严格限制在本地源路径内的文件;请确保文件权限允许代理访问源文件。

  • 若缺少 pyyaml 库,元数据提取将会静默失败;请确保通过 pip install kurt-core 完成 Kurt 环境的完整初始化。

  • 此工具旨在进行高级内容管理与恢复;执行批量操作后,务必使用 kurt content list 确认数据库状态。

仓库统计

Star 数
2
Fork 数
0
Open Issue 数
0
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年5月3日 20:27
在 GitHub 查看