生产力
openai-whisper avatar

openai-whisper

使用 Whisper CLI 进行本地语音转文字转录。无需 API 密钥,即可直接在您的设备上将音频文件或录音转换为文字。

简介

openai-whisper 技能为您的 OpenClaw 助理提供了一个无缝、本地优先的语音转文字(STT)转录引擎。通过在本地利用 OpenAI Whisper CLI,此工具消除了对云端 API 订阅的需求,确保您的音频资料保持私密,并完全在您的硬件上进行处理。它专为需要高质量、可靠的语音备忘录、会议录音或媒体文件转录,同时又不希望承担与远程 AI 服务相关的延迟或隐私问题的用户而设计。

  • 本地转录处理:Whisper 模型直接在您的设备上执行,确保完整的数据主权与隐私。

  • CLI 驱动效率:利用强大的 Whisper 命令行接口进行可靠的批处理与自动化。

  • 弹性模型选择:支持多种 Whisper 模型大小(从小到 turbo),让用户能在转录速度与语言准确度之间取得平衡。

  • 多格式输出支持:轻松生成纯文本 (txt) 或字幕文件 (srt) 等多种格式的输出。

  • 翻译能力:内置支持将音频内容翻译为英语,作为转录工作流程的一部分。

  • 安装要求:模型在首次执行时会自动下载至 ~/.cache/whisper;请确保所选模型大小有足够的磁盘空间。

  • 性能优化:对于更快速的即时转录需求,请优先使用较小的模型版本;对于最高精确度与复杂口音,请选择较大的模型版本。

  • 使用方式:执行工具时需提供音频文件路径(例如 .mp3、.m4a)、指定所需的模型并定义输出目录。

  • 限制:性能取决于主机的硬件性能(CPU/GPU 可用性);请避免在资源受限的设备上执行过大的模型,以免造成系统迟缓。

仓库统计

Star 数
365,661
Fork 数
74,940
Open Issue 数
6,976
主要语言
TypeScript
默认分支
main
同步状态
空闲
最近同步时间
2026年4月28日 12:36
在 GitHub 查看