自動化
video-subtitle-cutter avatar

video-subtitle-cutter

自動化影片剪輯工作流:使用 Whisper 轉錄語音,結合 AI 分析識別冗詞、停頓與錯誤片段,並自動生成 FFmpeg 命令進行高品質影片裁切。

簡介

此技能作為專業的影片剪輯代理人,旨在透過自動移除不必要的影音片段來簡化後期製作流程。非常適合內容創作者、播客主與教育工作者,無需手動逐幀剪輯即可將未經潤飾的素材轉化為精簡、專業的媒體內容。透過利用 OpenAI 的 Whisper 或本地轉錄模型,該代理人能將音訊轉換為精確的時間標記 JSON 字幕。接著,它利用 AI 分析這些字幕,識別諸如「嗯」、「呃」之類的冗詞、重複短語、尷尬的停頓以及語句重啟。一旦確定目標片段,代理人會生成優化的 FFmpeg 命令序列,在刪除冗餘部分的同時保持完美的影音同步。

  • 使用 Whisper 對影片檔案進行自動轉錄,精確提取時間軸。

  • AI 驅動的內容分析,用於標記冗詞、重複內容、離題談話與長間隔靜音。

  • 智慧型片段規劃,合併相鄰保留片段並尊重自然斷句邊界。

  • 生成穩健的 FFmpeg 處理腳本,嚴格避免使用 -c copy,透過強制重新編碼確保剪輯流暢度。

  • 透過可調整的 CRF 設定進行品質管理,平衡檔案大小與視覺忠實度。

  • 支援生成 SRT 字幕,以及選配的硬編碼字幕燒錄功能以進行最終輸出。

  • 主要工作流包含轉錄、AI 提示分析與執行基於 Python 的 FFmpeg 腳本。

  • 使用者需確保 macOS 或 Linux 環境已正確配置 FFmpeg 與 Python 依賴項。

  • 本工具強制使用 libx264 重新編碼以防止常見於直接複製流時產生的畫面凍結與播放錯誤。

  • 使用者可透過設定 15(近乎無損)至 28(高壓縮比)的 CRF 參數來調整輸出品質。

  • 處理大型影片檔時,建議預先將音訊提取為 MP3 以加快轉錄速度。

  • 代理人可自動管理拼接協定與臨時檔案的清理流程。

倉庫統計

Star 數
221
Fork 數
43
Open Issue 數
5
主要語言
TypeScript
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月30日 上午11:21
在 GitHub 查看