video-subtitle-cutter
自动化视频剪辑工作流:使用 Whisper 转录语音,结合 AI 分析识别冗词、停顿与错误片段,并自动生成 FFmpeg 命令进行高质量视频裁剪。
简介
此技能作为专业的视频剪辑代理人,旨在通过自动移除不必要的音视频片段来简化后期制作流程。非常适合内容创作者、播客主与教育工作者,无需手动逐帧剪辑即可将未经润饰的素材转化为精简、专业的媒体内容。通过利用 OpenAI 的 Whisper 或本地转录模型,该代理人能将音频转换为精确的时间标记 JSON 字幕。接着,它利用 AI 分析这些字幕,识别诸如“嗯”、“呃”之类的冗词、重复短语、尴尬的停顿以及语句重启。一旦确定目标片段,代理人会生成优化的 FFmpeg 命令序列,在删除冗余部分的同时保持完美的音视频同步。
-
使用 Whisper 对视频文件进行自动转录,精确提取时间轴。
-
AI 驱动的内容分析,用于标记冗词、重复内容、离题谈话与长间隔静音。
-
智能型片段规划,合并相邻保留片段并尊重自然断句边界。
-
生成稳健的 FFmpeg 处理脚本,严格避免使用 -c copy,通过强制重新编码确保剪辑流畅度。
-
通过可调整的 CRF 设置进行质量管理,平衡文件大小与视觉忠实度。
-
支持生成 SRT 字幕,以及选配的硬编码字幕烧录功能以进行最终输出。
-
主要工作流包含转录、AI 提示分析与执行基于 Python 的 FFmpeg 脚本。
-
用户需确保 macOS 或 Linux 环境已正确配置 FFmpeg 与 Python 依赖项。
-
本工具强制使用 libx264 重新编码以防止常见于直接复制流时产生的画面冻结与播放错误。
-
用户可通过设定 15(近乎无损)至 28(高压缩比)的 CRF 参数来调整输出质量。
-
处理大型视频档时,建议预先将音频提取为 MP3 以加快转录速度。
-
代理人可自动管理拼接协议与临时文件的清理流程。
仓库统计
- Star 数
- 221
- Fork 数
- 43
- Open Issue 数
- 5
- 主要语言
- TypeScript
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年4月30日 11:21