自动化
video-subtitle-cutter avatar

video-subtitle-cutter

自动化视频剪辑工作流:使用 Whisper 转录语音,结合 AI 分析识别冗词、停顿与错误片段,并自动生成 FFmpeg 命令进行高质量视频裁剪。

简介

此技能作为专业的视频剪辑代理人,旨在通过自动移除不必要的音视频片段来简化后期制作流程。非常适合内容创作者、播客主与教育工作者,无需手动逐帧剪辑即可将未经润饰的素材转化为精简、专业的媒体内容。通过利用 OpenAI 的 Whisper 或本地转录模型,该代理人能将音频转换为精确的时间标记 JSON 字幕。接着,它利用 AI 分析这些字幕,识别诸如“嗯”、“呃”之类的冗词、重复短语、尴尬的停顿以及语句重启。一旦确定目标片段,代理人会生成优化的 FFmpeg 命令序列,在删除冗余部分的同时保持完美的音视频同步。

  • 使用 Whisper 对视频文件进行自动转录,精确提取时间轴。

  • AI 驱动的内容分析,用于标记冗词、重复内容、离题谈话与长间隔静音。

  • 智能型片段规划,合并相邻保留片段并尊重自然断句边界。

  • 生成稳健的 FFmpeg 处理脚本,严格避免使用 -c copy,通过强制重新编码确保剪辑流畅度。

  • 通过可调整的 CRF 设置进行质量管理,平衡文件大小与视觉忠实度。

  • 支持生成 SRT 字幕,以及选配的硬编码字幕烧录功能以进行最终输出。

  • 主要工作流包含转录、AI 提示分析与执行基于 Python 的 FFmpeg 脚本。

  • 用户需确保 macOS 或 Linux 环境已正确配置 FFmpeg 与 Python 依赖项。

  • 本工具强制使用 libx264 重新编码以防止常见于直接复制流时产生的画面冻结与播放错误。

  • 用户可通过设定 15(近乎无损)至 28(高压缩比)的 CRF 参数来调整输出质量。

  • 处理大型视频档时,建议预先将音频提取为 MP3 以加快转录速度。

  • 代理人可自动管理拼接协议与临时文件的清理流程。

仓库统计

Star 数
221
Fork 数
43
Open Issue 数
5
主要语言
TypeScript
默认分支
main
同步状态
空闲
最近同步时间
2026年4月30日 11:21
在 GitHub 查看