生產力
openai-whisper avatar

openai-whisper

使用 Whisper CLI 進行本地語音轉文字轉錄。無需 API 金鑰,即可直接在您的設備上將音訊檔案或錄音轉換為文字。

簡介

openai-whisper 技能為您的 OpenClaw 助理提供了一個無縫、本地優先的語音轉文字(STT)轉錄引擎。透過在本地利用 OpenAI Whisper CLI,此工具消除了對雲端 API 訂閱的需求,確保您的音訊資料保持私密,並完全在您的硬體上進行處理。它專為需要高品質、可靠的語音備忘錄、會議錄音或媒體檔案轉錄,同時又不希望承擔與遠端 AI 服務相關的延遲或隱私問題的使用者而設計。

  • 本地轉錄處理:Whisper 模型直接在您的設備上執行,確保完整的資料主權與隱私。

  • CLI 驅動效率:利用強大的 Whisper 命令列介面進行可靠的批次處理與自動化。

  • 彈性模型選擇:支援多種 Whisper 模型大小(從小到 turbo),讓使用者能在轉錄速度與語言準確度之間取得平衡。

  • 多格式輸出支援:輕鬆產生純文字 (txt) 或字幕檔 (srt) 等多種格式的輸出。

  • 翻譯能力:內建支援將音訊內容翻譯為英語,作為轉錄工作流程的一部分。

  • 安裝要求:模型在首次執行時會自動下載至 ~/.cache/whisper;請確保所選模型大小有足夠的磁碟空間。

  • 效能優化:對於更快速的即時轉錄需求,請優先使用較小的模型版本;對於最高精確度與複雜口音,請選擇較大的模型版本。

  • 使用方式:執行工具時需提供音訊檔案路徑(例如 .mp3、.m4a)、指定所需的模型並定義輸出目錄。

  • 限制:效能取決於主機的硬體效能(CPU/GPU 可用性);請避免在資源受限的設備上執行過大的模型,以免造成系統遲緩。

倉庫統計

Star 數
365,661
Fork 數
74,940
Open Issue 數
6,976
主要語言
TypeScript
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月28日 下午12:36
在 GitHub 查看