内容创作
videocut:剪口播 avatar

videocut:剪口播

AI 驱动的口播视频剪辑 Agent,提供语音转录、口误识别与网页版审核流程。

简介

此 Agent 是一款专为“口播视频”设计的自动化剪辑工具,旨在解决传统剪辑软件无法理解语境的痛点。通过结合火山引擎的高准确度语音转录与 Claude 的语义分析能力,Agent 能自动识别重复语句、话语纠正、卡顿词与静音片段。它将繁琐的剪辑工作转化为结构化的数字任务,并提供网页版审核界面,确保最终剪辑结果既精准又符合人工语感。

  • 语义分析能力:深度分析文本,自动识别“重复句”、“残句”、“纠正重说”与“填充词”,而不仅仅是模式匹配。

  • 字级时间戳:精确到字符级的转录与时间轴标记,结合 >0.2s 的静音检测,实现细粒度的内容筛选。

  • 审核与执行:自动生成 review.html 审核界面,支持用户在网页中播放预览、点击调整剪辑范围,并一键触发 FFmpeg 高画质剪辑。

  • 专业编码输出:采用滤镜组合(filter_complex)进行精确的帧级剪辑,并自动匹配原片参数(Bitrate/Profile/Pix_fmt)进行重编码,确保画质与声音同步。

  • 结构化工作流:自动建立标准化文件夹结构,包含转录文件、口误分析报告与剪辑记录,便于长期维护与追踪。

  • 输入:接受 MP4 格式视频,需配置火山引擎 API Key 以进行转录。

  • 输出:产出字幕 JSON 文件、AI 口误建议列表、剪辑后的 MP4 文件。

  • 环境需求:需安装 Node.js、Python 与 FFmpeg。

  • 操作建议:建议用户维护“用户习惯”配置文件,并定期通过自更新机制调整删除阈值与语气词偏好,以提升后续剪辑的自动化精准度。

仓库统计

Star 数
1,515
Fork 数
248
Open Issue 数
17
主要语言
JavaScript
默认分支
main
同步状态
空闲
最近同步时间
2026年5月3日 20:22
在 GitHub 查看