內容創作
videocut:剪口播 avatar

videocut:剪口播

AI 驅動的口播影片剪輯 Agent,提供語音轉錄、口誤偵測與網頁版審核流程。

簡介

此 Agent 是一款專為「口播影片」設計的自動化剪輯工具,旨在解決傳統剪輯軟體無法理解語義的痛點。透過結合火山引擎的高準確度語音轉錄與 Claude 的語義分析能力,Agent 能自動識別重複語句、話語糾正、卡頓詞與靜音片段。它將繁瑣的剪輯工作轉化為結構化的數位任務,並提供網頁版審核介面,確保最終剪輯結果既精準又符合人工語感。

  • 語義分析能力:深度分析文本,自動辨識「重複句」、「殘句」、「糾正重說」與「填充詞」,而不僅僅是匹配模式。

  • 字級時間戳:精確到字元級的轉錄與時間軸標記,結合 >0.2s 的靜音偵測,實現細粒度的內容篩選。

  • 審核與執行:自動生成 review.html 審核介面,支援使用者在網頁中播放預覽、點擊調整剪輯範圍,並一鍵觸發 FFmpeg 高畫質剪輯。

  • 專業編碼輸出:採用濾鏡組合(filter_complex)進行精確的幀級剪輯,並自動匹配原片參數(Bitrate/Profile/Pix_fmt)進行重編碼,確保畫質與聲音同步。

  • 結構化工作流:自動建立標準化資料夾結構,包含轉錄檔、口誤分析報告與剪輯紀錄,便於長期維護與追蹤。

  • 輸入:接受 MP4 格式影片,需配置火山引擎 API Key 以進行轉錄。

  • 輸出:產出字幕 JSON 檔、AI 口誤建議列表、剪輯後之 MP4 檔案。

  • 環境需求:需安裝 Node.js、Python 與 FFmpeg。

  • 操作建議:建議使用者維護「用戶習慣」設定檔,並定期透過自更新機制調整刪除阈值與語氣詞偏好,以提升後續剪輯的自動化精準度。

倉庫統計

Star 數
1,515
Fork 數
248
Open Issue 數
17
主要語言
JavaScript
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月3日 下午08:22
在 GitHub 查看