video-pipeline

简介

Video Pipeline 是一个全方位的自动化 Agent 技能，旨在简化视频内容的全生命周期加工。它作为核心编排器，整合了转录、观点提取、视频剪辑与文章撰写等多个子技能，将直播回放、播客录音或会议记录等原始音视频素材，自动转化为专业的成品内容。该方案特别适合内容创作者、营销团队与知识工作者，帮助他们高效地将长视频内容进行多形式二次利用，减少手动操作的繁琐。

串联四阶段流水线：自动化语音转录、观点提炼、智能剪辑与文章生成。
使用 WhisperX 提供高精度的语音转录，支持说话人识别 (diarization) 与词级时间戳对齐。
内置智能切片逻辑，自动去除静音与冗词，并精确侦测最具传播力的“金句”与争议焦点片段。
根据原始素材与观点摘要，自动合成适配博客、知乎或微信公众号的格式化文章。
采用子 Agent 分流机制，实现观点提炼与视频切片阶段的并行处理，显著提升整体吞吐量。
建立完整的工作区目录，系统化管理所有中间产物与最终生成的资产。
输入要求：提供视频文件路径，可配置项目名称、产出范围、目标平台及切片数量。
产出清单：包含完整文字稿 (txt/json)、结构化观点摘要 (insights.md)、短视频切片 (clips/) 以及多平台格式文章 (articles/)。
系统需求：需依赖 ffmpeg、whisperX 及 HuggingFace Token 进行说话人分离。支持使用 nohup 进行后台任务调度以稳定处理长时视频。
使用建议：观点提炼阶段是后续剪辑与文章创作的基础，建议完整执行以确保最终产出的深度与准确性。

创业课程

在线课程

实体课程

简介

仓库统计