生产力
edge-tts avatar

edge-tts

使用 Microsoft Edge 神经语音引擎,通过 uvx edge-tts 生成高质量的文字转语音音频。

简介

edge-tts 技能为将文字转换为自然的语音提供了强大的接口,利用 Microsoft Edge 的先进神经文字转语音服务。通过使用 uvx edge-tts 命令,此技能使智能代理能够进行无缝的语音整合,允许它们提供听觉响应、协助无障碍需求,或处理多工场景下的内容生成。它支持跨多种语言的各种声音,包括英语、中文和法语,并可对音频参数进行细致的控制。

  • 支持具有自然韵律和语调的高质量神经语音。

  • 可配置的音频设置,包括语速(rate)、音量调整(volume)和音高修正(pitch)。

  • 除了标准音频输出外,还具有生成同步字幕文件的功能。

  • 可列出所有可用语音,以便进行特定的区域和性别定制化。

  • 非常适合无障碍辅助工具、长文阅读协助,以及为视频或多媒体项目制作旁白。

  • 常见用法是将文字内容作为输入变量传递给 shell 命令;请确保以预期的临时目录格式提供输出文件路径。

  • 输出以媒体文件(通常为 .mp3)形式提供,可由代理环境进一步处理或播放。

  • 限制:需要已安装 uv/uvx 的系统才能执行 edge-tts 工具;请确保互联网连接,因为该服务需与 Microsoft 的后端通信以进行语音合成。

  • 若要获得最佳效果,请指定 --voice 参数以符合所需的语言和角色个性,例如用于专业朗读的 en-US-AriaNeural 或用于对话任务的 zh-CN-XiaoxiaoNeural。

仓库统计

Star 数
120
Fork 数
12
Open Issue 数
0
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年5月1日 09:12
在 GitHub 查看