生產力
openai-whisper
使用 Whisper CLI 進行本地語音轉文字轉錄。無需 API 金鑰,即可直接在您的設備上將音訊檔案或錄音轉換為文字。
簡介
openai-whisper 技能為您的 OpenClaw 助理提供了一個無縫、本地優先的語音轉文字(STT)轉錄引擎。透過在本地利用 OpenAI Whisper CLI,此工具消除了對雲端 API 訂閱的需求,確保您的音訊資料保持私密,並完全在您的硬體上進行處理。它專為需要高品質、可靠的語音備忘錄、會議錄音或媒體檔案轉錄,同時又不希望承擔與遠端 AI 服務相關的延遲或隱私問題的使用者而設計。
-
本地轉錄處理:Whisper 模型直接在您的設備上執行,確保完整的資料主權與隱私。
-
CLI 驅動效率:利用強大的 Whisper 命令列介面進行可靠的批次處理與自動化。
-
彈性模型選擇:支援多種 Whisper 模型大小(從小到 turbo),讓使用者能在轉錄速度與語言準確度之間取得平衡。
-
多格式輸出支援:輕鬆產生純文字 (txt) 或字幕檔 (srt) 等多種格式的輸出。
-
翻譯能力:內建支援將音訊內容翻譯為英語,作為轉錄工作流程的一部分。
-
安裝要求:模型在首次執行時會自動下載至 ~/.cache/whisper;請確保所選模型大小有足夠的磁碟空間。
-
效能優化:對於更快速的即時轉錄需求,請優先使用較小的模型版本;對於最高精確度與複雜口音,請選擇較大的模型版本。
-
使用方式:執行工具時需提供音訊檔案路徑(例如 .mp3、.m4a)、指定所需的模型並定義輸出目錄。
-
限制:效能取決於主機的硬體效能(CPU/GPU 可用性);請避免在資源受限的設備上執行過大的模型,以免造成系統遲緩。
倉庫統計
- Star 數
- 365,661
- Fork 數
- 74,940
- Open Issue 數
- 6,976
- 主要語言
- TypeScript
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年4月28日 下午12:36