内容创作
video-pipeline avatar

video-pipeline

视频内容全链路处理流水线,将原始录影自动转化为逐字稿、观点摘要、短视频切片及可发布文章。

简介

Video Pipeline 是一个全方位的自动化 Agent 技能,旨在简化视频内容的全生命周期加工。它作为核心编排器,整合了转录、观点提取、视频剪辑与文章撰写等多个子技能,将直播回放、播客录音或会议记录等原始音视频素材,自动转化为专业的成品内容。该方案特别适合内容创作者、营销团队与知识工作者,帮助他们高效地将长视频内容进行多形式二次利用,减少手动操作的繁琐。

  • 串联四阶段流水线:自动化语音转录、观点提炼、智能剪辑与文章生成。

  • 使用 WhisperX 提供高精度的语音转录,支持说话人识别 (diarization) 与词级时间戳对齐。

  • 内置智能切片逻辑,自动去除静音与冗词,并精确侦测最具传播力的“金句”与争议焦点片段。

  • 根据原始素材与观点摘要,自动合成适配博客、知乎或微信公众号的格式化文章。

  • 采用子 Agent 分流机制,实现观点提炼与视频切片阶段的并行处理,显著提升整体吞吐量。

  • 建立完整的工作区目录,系统化管理所有中间产物与最终生成的资产。

  • 输入要求:提供视频文件路径,可配置项目名称、产出范围、目标平台及切片数量。

  • 产出清单:包含完整文字稿 (txt/json)、结构化观点摘要 (insights.md)、短视频切片 (clips/) 以及多平台格式文章 (articles/)。

  • 系统需求:需依赖 ffmpeg、whisperX 及 HuggingFace Token 进行说话人分离。支持使用 nohup 进行后台任务调度以稳定处理长时视频。

  • 使用建议:观点提炼阶段是后续剪辑与文章创作的基础,建议完整执行以确保最终产出的深度与准确性。

仓库统计

Star 数
1
Fork 数
1
Open Issue 数
0
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年5月3日 22:01
在 GitHub 查看