生产力
edge-tts-uvx avatar

edge-tts-uvx

使用 Microsoft Edge 神经 TTS 服务生成高质量语音。支持多种语言、语音选择以及语速、音调与格式调整。

简介

edge-tts-uvx 技能提供了一个命令行界面,可连接强大的 Microsoft Edge 神经文字转语音服务,让使用者能将文字文档、消息或脚本转换为听起来自然的音频文件。此工具专为需要可靠音频生成且不希望有外部依赖的开发者、内容创作者及重视无障碍功能的用户所设计。通过 node-edge-tts 引擎,此技能可无缝整合至自动化工作流程,例如读回 AI 生成的文字、创建无障碍内容或为媒体项目制作旁白。对于需要多任务处理或在不同数字环境中需要专业语音调节的用户来说,这是一个极佳的工具。

  • 支持包含多种区域、语言与口音的庞大神经语音库,包含自然且专业的男女声角色。

  • 提供对音频输出参数的细致控制,包含可自定义的语速(rate)、音调(pitch)调整及音量(volume)控制,以符合特定项目需求。

  • 支持在产生音频的同时生成字幕文件(subtitles),简化无障碍多媒体内容的制作流程。

  • 灵活的输出选项,允许用户将音频导出为 MP3 等常见媒体格式。

  • 可通过 shell 指令直接存取语音元数据,方便审计与管理当前可用的语音资源。

  • 输入需求为纯文字内容,输出则为指定临时目录中的高保真音频媒体文件。

  • 本工具通过 uvx edge-tts 调用,确保环境可携带且隔离,无需全局安装依赖。

  • 性能取决于连接 Microsoft Edge TTS 端点的网络状况;在执行语音合成任务时请确保网络连接稳定。

  • 用户应利用 --list-voices 指令来探索并选择最适合的语音角色,例如英语的 US-Aria 或中文的 CN-Xiaoxiao,具体取决于目标文字的语言情境。

  • 制作旁白时,请正确指定输出文件路径,以避免覆盖现有媒体,并确保文件命名规范正确。

仓库统计

Star 数
4,454
Fork 数
1,215
Open Issue 数
7
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年4月30日 11:26
在 GitHub 查看