简介

此技能作为专业的视频剪辑代理人，旨在通过自动移除不必要的音视频片段来简化后期制作流程。非常适合内容创作者、播客主与教育工作者，无需手动逐帧剪辑即可将未经润饰的素材转化为精简、专业的媒体内容。通过利用 OpenAI 的 Whisper 或本地转录模型，该代理人能将音频转换为精确的时间标记 JSON 字幕。接着，它利用 AI 分析这些字幕，识别诸如“嗯”、“呃”之类的冗词、重复短语、尴尬的停顿以及语句重启。一旦确定目标片段，代理人会生成优化的 FFmpeg 命令序列，在删除冗余部分的同时保持完美的音视频同步。

使用 Whisper 对视频文件进行自动转录，精确提取时间轴。
AI 驱动的内容分析，用于标记冗词、重复内容、离题谈话与长间隔静音。
智能型片段规划，合并相邻保留片段并尊重自然断句边界。
生成稳健的 FFmpeg 处理脚本，严格避免使用 -c copy，通过强制重新编码确保剪辑流畅度。
通过可调整的 CRF 设置进行质量管理，平衡文件大小与视觉忠实度。
支持生成 SRT 字幕，以及选配的硬编码字幕烧录功能以进行最终输出。
主要工作流包含转录、AI 提示分析与执行基于 Python 的 FFmpeg 脚本。
用户需确保 macOS 或 Linux 环境已正确配置 FFmpeg 与 Python 依赖项。
本工具强制使用 libx264 重新编码以防止常见于直接复制流时产生的画面冻结与播放错误。
用户可通过设定 15（近乎无损）至 28（高压缩比）的 CRF 参数来调整输出质量。
处理大型视频档时，建议预先将音频提取为 MP3 以加快转录速度。
代理人可自动管理拼接协议与临时文件的清理流程。

创业课程

在线课程

实体课程

video-subtitle-cutter

简介

仓库统计