內容創作
videocut:剪口播
AI 驅動的口播影片剪輯 Agent,提供語音轉錄、口誤偵測與網頁版審核流程。
簡介
此 Agent 是一款專為「口播影片」設計的自動化剪輯工具,旨在解決傳統剪輯軟體無法理解語義的痛點。透過結合火山引擎的高準確度語音轉錄與 Claude 的語義分析能力,Agent 能自動識別重複語句、話語糾正、卡頓詞與靜音片段。它將繁瑣的剪輯工作轉化為結構化的數位任務,並提供網頁版審核介面,確保最終剪輯結果既精準又符合人工語感。
-
語義分析能力:深度分析文本,自動辨識「重複句」、「殘句」、「糾正重說」與「填充詞」,而不僅僅是匹配模式。
-
字級時間戳:精確到字元級的轉錄與時間軸標記,結合 >0.2s 的靜音偵測,實現細粒度的內容篩選。
-
審核與執行:自動生成 review.html 審核介面,支援使用者在網頁中播放預覽、點擊調整剪輯範圍,並一鍵觸發 FFmpeg 高畫質剪輯。
-
專業編碼輸出:採用濾鏡組合(filter_complex)進行精確的幀級剪輯,並自動匹配原片參數(Bitrate/Profile/Pix_fmt)進行重編碼,確保畫質與聲音同步。
-
結構化工作流:自動建立標準化資料夾結構,包含轉錄檔、口誤分析報告與剪輯紀錄,便於長期維護與追蹤。
-
輸入:接受 MP4 格式影片,需配置火山引擎 API Key 以進行轉錄。
-
輸出:產出字幕 JSON 檔、AI 口誤建議列表、剪輯後之 MP4 檔案。
-
環境需求:需安裝 Node.js、Python 與 FFmpeg。
-
操作建議:建議使用者維護「用戶習慣」設定檔,並定期透過自更新機制調整刪除阈值與語氣詞偏好,以提升後續剪輯的自動化精準度。
倉庫統計
- Star 數
- 1,515
- Fork 數
- 248
- Open Issue 數
- 17
- 主要語言
- JavaScript
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年5月3日 下午08:22