生产力
openai-whisper
使用 Whisper CLI 进行本地语音转文字转录。无需 API 密钥,即可直接在您的设备上将音频文件或录音转换为文字。
简介
openai-whisper 技能为您的 OpenClaw 助理提供了一个无缝、本地优先的语音转文字(STT)转录引擎。通过在本地利用 OpenAI Whisper CLI,此工具消除了对云端 API 订阅的需求,确保您的音频资料保持私密,并完全在您的硬件上进行处理。它专为需要高质量、可靠的语音备忘录、会议录音或媒体文件转录,同时又不希望承担与远程 AI 服务相关的延迟或隐私问题的用户而设计。
-
本地转录处理:Whisper 模型直接在您的设备上执行,确保完整的数据主权与隐私。
-
CLI 驱动效率:利用强大的 Whisper 命令行接口进行可靠的批处理与自动化。
-
弹性模型选择:支持多种 Whisper 模型大小(从小到 turbo),让用户能在转录速度与语言准确度之间取得平衡。
-
多格式输出支持:轻松生成纯文本 (txt) 或字幕文件 (srt) 等多种格式的输出。
-
翻译能力:内置支持将音频内容翻译为英语,作为转录工作流程的一部分。
-
安装要求:模型在首次执行时会自动下载至 ~/.cache/whisper;请确保所选模型大小有足够的磁盘空间。
-
性能优化:对于更快速的即时转录需求,请优先使用较小的模型版本;对于最高精确度与复杂口音,请选择较大的模型版本。
-
使用方式:执行工具时需提供音频文件路径(例如 .mp3、.m4a)、指定所需的模型并定义输出目录。
-
限制:性能取决于主机的硬件性能(CPU/GPU 可用性);请避免在资源受限的设备上执行过大的模型,以免造成系统迟缓。
仓库统计
- Star 数
- 365,661
- Fork 数
- 74,940
- Open Issue 数
- 6,976
- 主要语言
- TypeScript
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年4月28日 12:36