内容创作
video-pipeline
视频内容全链路处理流水线,将原始录影自动转化为逐字稿、观点摘要、短视频切片及可发布文章。
简介
Video Pipeline 是一个全方位的自动化 Agent 技能,旨在简化视频内容的全生命周期加工。它作为核心编排器,整合了转录、观点提取、视频剪辑与文章撰写等多个子技能,将直播回放、播客录音或会议记录等原始音视频素材,自动转化为专业的成品内容。该方案特别适合内容创作者、营销团队与知识工作者,帮助他们高效地将长视频内容进行多形式二次利用,减少手动操作的繁琐。
-
串联四阶段流水线:自动化语音转录、观点提炼、智能剪辑与文章生成。
-
使用 WhisperX 提供高精度的语音转录,支持说话人识别 (diarization) 与词级时间戳对齐。
-
内置智能切片逻辑,自动去除静音与冗词,并精确侦测最具传播力的“金句”与争议焦点片段。
-
根据原始素材与观点摘要,自动合成适配博客、知乎或微信公众号的格式化文章。
-
采用子 Agent 分流机制,实现观点提炼与视频切片阶段的并行处理,显著提升整体吞吐量。
-
建立完整的工作区目录,系统化管理所有中间产物与最终生成的资产。
-
输入要求:提供视频文件路径,可配置项目名称、产出范围、目标平台及切片数量。
-
产出清单:包含完整文字稿 (txt/json)、结构化观点摘要 (insights.md)、短视频切片 (clips/) 以及多平台格式文章 (articles/)。
-
系统需求:需依赖 ffmpeg、whisperX 及 HuggingFace Token 进行说话人分离。支持使用 nohup 进行后台任务调度以稳定处理长时视频。
-
使用建议:观点提炼阶段是后续剪辑与文章创作的基础,建议完整执行以确保最终产出的深度与准确性。
仓库统计
- Star 数
- 1
- Fork 数
- 1
- Open Issue 数
- 0
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 22:01