內容創作
video-watcher
擷取 YouTube 與 Bilibili 影片字幕,支援自動摘要、問答與資訊提取,基於 yt-dlp 實作。
簡介
video-watcher 技能是 AI 代理與高階使用者高效處理影音內容的必備工具。透過整合工業標準的 yt-dlp 函式庫,它能從 YouTube 與 Bilibili 這兩大教育、技術與創意內容平台中提取隱藏字幕 (CC) 或自動生成的轉錄稿。本技能將原始影片連結轉換為乾淨、可閱讀的文字內容,是後續進行影片摘要、語意搜尋與資訊檢索等流程中極為關鍵的前處理步驟。
-
自動偵測影片平台來源,包含 youtube.com、youtu.be、bilibili.com 與 b23.tv,無需手動設定參數。
-
支援多語言字幕提取,使用者可透過 CLI 參數指定語言,例如英語 (en)、簡體中文 (zh-CN)、繁體中文 (zh-TW)、日語 (ja) 或韓語 (ko) 等。
-
為大規模影音資料庫提供快速處理能力,使 AI 代理能夠在不看完影片的情況下精準回答關於影片內容的問題。
-
可無縫整合至現有的自動化腳本或 Agent 工作流中,透過簡單的 Bash 指令即可完成呼叫。
-
輸出純文字內容,完美對接後續的大型語言模型 (LLM) 分析或進階文字處理工具。
-
執行此腳本前,系統需安裝 yt-dlp 並確保其位於系統環境變數 PATH 中。
-
此工具僅適用於具備隱藏字幕或自動生成字幕的影片;若影片缺乏字幕軌道,系統將回傳錯誤訊息。
-
預設語言設定針對平台特性進行最佳化,YouTube 預設為英文,Bilibili 預設為簡體中文。
-
使用者需理解轉錄稿品質取決於原始影片的中繼資料以及自動生成字幕的準確度。
-
非常適合研究人員、內容創作者以及需要大量消化技術教學、系列講座或紀錄片內容的開發者。
倉庫統計
- Star 數
- 4,437
- Fork 數
- 1,203
- Open Issue 數
- 7
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年4月29日 下午01:14