内容创作
videocut:剪口播
AI 驱动的口播视频剪辑 Agent,提供语音转录、口误识别与网页版审核流程。
简介
此 Agent 是一款专为“口播视频”设计的自动化剪辑工具,旨在解决传统剪辑软件无法理解语境的痛点。通过结合火山引擎的高准确度语音转录与 Claude 的语义分析能力,Agent 能自动识别重复语句、话语纠正、卡顿词与静音片段。它将繁琐的剪辑工作转化为结构化的数字任务,并提供网页版审核界面,确保最终剪辑结果既精准又符合人工语感。
-
语义分析能力:深度分析文本,自动识别“重复句”、“残句”、“纠正重说”与“填充词”,而不仅仅是模式匹配。
-
字级时间戳:精确到字符级的转录与时间轴标记,结合 >0.2s 的静音检测,实现细粒度的内容筛选。
-
审核与执行:自动生成 review.html 审核界面,支持用户在网页中播放预览、点击调整剪辑范围,并一键触发 FFmpeg 高画质剪辑。
-
专业编码输出:采用滤镜组合(filter_complex)进行精确的帧级剪辑,并自动匹配原片参数(Bitrate/Profile/Pix_fmt)进行重编码,确保画质与声音同步。
-
结构化工作流:自动建立标准化文件夹结构,包含转录文件、口误分析报告与剪辑记录,便于长期维护与追踪。
-
输入:接受 MP4 格式视频,需配置火山引擎 API Key 以进行转录。
-
输出:产出字幕 JSON 文件、AI 口误建议列表、剪辑后的 MP4 文件。
-
环境需求:需安装 Node.js、Python 与 FFmpeg。
-
操作建议:建议用户维护“用户习惯”配置文件,并定期通过自更新机制调整删除阈值与语气词偏好,以提升后续剪辑的自动化精准度。
仓库统计
- Star 数
- 1,515
- Fork 数
- 248
- Open Issue 数
- 17
- 主要语言
- JavaScript
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 20:22