生产力
edge-tts
使用 Microsoft Edge 神经语音引擎,通过 uvx edge-tts 生成高质量的文字转语音音频。
简介
edge-tts 技能为将文字转换为自然的语音提供了强大的接口,利用 Microsoft Edge 的先进神经文字转语音服务。通过使用 uvx edge-tts 命令,此技能使智能代理能够进行无缝的语音整合,允许它们提供听觉响应、协助无障碍需求,或处理多工场景下的内容生成。它支持跨多种语言的各种声音,包括英语、中文和法语,并可对音频参数进行细致的控制。
-
支持具有自然韵律和语调的高质量神经语音。
-
可配置的音频设置,包括语速(rate)、音量调整(volume)和音高修正(pitch)。
-
除了标准音频输出外,还具有生成同步字幕文件的功能。
-
可列出所有可用语音,以便进行特定的区域和性别定制化。
-
非常适合无障碍辅助工具、长文阅读协助,以及为视频或多媒体项目制作旁白。
-
常见用法是将文字内容作为输入变量传递给 shell 命令;请确保以预期的临时目录格式提供输出文件路径。
-
输出以媒体文件(通常为 .mp3)形式提供,可由代理环境进一步处理或播放。
-
限制:需要已安装 uv/uvx 的系统才能执行 edge-tts 工具;请确保互联网连接,因为该服务需与 Microsoft 的后端通信以进行语音合成。
-
若要获得最佳效果,请指定 --voice 参数以符合所需的语言和角色个性,例如用于专业朗读的 en-US-AriaNeural 或用于对话任务的 zh-CN-XiaoxiaoNeural。
仓库统计
- Star 数
- 120
- Fork 数
- 12
- Open Issue 数
- 0
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月1日 09:12