簡介

openai-whisper 技能讓 OpenClaw 用戶能夠進行高品質的本地語音轉文字 (STT) 轉錄。透過直接在本地機器上利用 OpenAI Whisper 模型的功能，此技能確保您的敏感音訊檔案、會議記錄或個人語音筆記永遠不會離開裝置進行處理。它消除了對基於雲端的語音轉文字服務的依賴，繞過了 API 金鑰需求和訂閱成本，同時保持對數據隱私的完全控制。

本地優先轉錄：使用本地硬體資源在離線狀態下執行所有音訊處理。
模型選擇靈活性：支援多種 Whisper 模型大小（如 turbo、medium），可根據硬體效能平衡處理速度與轉錄準確度。
格式多樣性：輸出標準格式（如 TXT 和 SRT），方便與字幕或文件工作流整合。
翻譯能力：支援多語言翻譯任務，實現高效的跨語言文件處理。
無需 API 金鑰：完全獨立於雲端基礎設施運作，非常適合對數據安全有嚴格要求的用戶。
使用此技能前，請確保 Whisper CLI 已在您的環境中正確配置。首次執行時，系統會將必要的模型權重下載至本地快取目錄（通常位於 ~/.cache/whisper）。
若要在一般消費者硬體上獲得更快的效能，建議使用預設的 'turbo' 模型或較小的變體；若需要在複雜音訊環境下提高準確度，則可選擇較大的模型。
可輸入常見格式的音訊檔案，如 MP3 或 M4A。
使用任務參數指定轉錄或翻譯工作流；例如，將任務設為 'translate' 可自動將輸入音訊轉換為目標語言的轉錄文字。
適用於在安全、本地環境中轉錄語音備忘錄、Podcast、訪談和會議，且無需網路連線。

創業課程

網上課程

實體課程

openai-whisper

簡介

倉庫統計