openai-whisper-api
使用 OpenAI Whisper API 將音訊檔案轉錄為文字,供您的 OpenClaw 助理使用。
簡介
openai-whisper-api 技能將 OpenAI 先進的語音轉文字功能直接整合至您的 OpenClaw 工作流程中。此技能專為依賴語音備忘錄、錄音或語音訊息的用戶設計,提供了一種可靠且快速的方法將口說內容轉換為可操作的文字。透過 OpenAI 音訊轉錄 API 使用 Whisper 模型,確保了對多種語言和音訊格式的高品質識別能力。這對於需要整理訪談的科研人員、記錄會議紀要的專業人士,或是任何希望提升助理語音處理能力的用戶來說,都是理想的工具。該技能高度可配置,支援自訂模型、語言提示及基於提示詞 (prompt) 的語境輸入,以獲得更準確的轉錄效果。
-
完整支援 OpenAI 所接受的標準音訊格式,包括 .m4a、.ogg 等。
-
與 OpenClaw 設定直接整合,簡化 API 金鑰管理。
-
靈活指定 Whisper 模型(如 whisper-1),以平衡效能與轉錄品質。
-
支援傳入特定語言參數,以提升非英語情境下的識別率。
-
透過 prompt 旗標支援具備語境感知的轉錄,對於包含講者姓名或特定專業術語的情況特別有效。
-
提供多樣化的輸出選項,可選擇原始文字或結構化的 JSON 格式,便於後續資料處理。
-
請確保在 ~/.openclaw/openclaw.json 中正確設定 OPENAI_API_KEY 以進行驗證。
-
您可以透過設定 OPENAI_BASE_URL 變數來使用與 OpenAI 相容的代理伺服器或本機閘道,支援離線或私有雲部署需求。
-
為了獲得最佳效果,請確保音訊檔案清晰;雖然 Whisper 對背景噪音具有強大的魯棒性,但嚴重的失真仍可能影響轉錄精度。
-
基於腳本的執行模式,使得此技能可以整合至更廣泛的 Shell 自動化鏈或批次處理任務中。
-
處理敏感資訊的用戶應確保其終端點設定符合資料傳輸的安全性要求。
倉庫統計
- Star 數
- 365,626
- Fork 數
- 74,932
- Open Issue 數
- 7,000
- 主要語言
- TypeScript
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年4月28日 上午11:37