Agent Skills Hub

探索可复用的代理技能，查看实现细节，快速找到适合你工作流程的技能。

共找到 103 个技能

生产力工程开发内容创作

speak

使用 Kokoro TTS 进行本地文字转语音。在终端中生成音频、朗读文本并处理多语言语音合成。

浏览: 11★ 4,453

工程开发自动化

text-to-speech

专业 Kokoro TTS 语音合成技能，专为 JARVIS 风格助手打造，提供离线、实时、安全的语音输出。包含流式合成、韵律控制及性能优化的音频生成功能。

浏览: 23★ 37

生产力内容创作自动化

edge-tts

使用 Microsoft Edge 神经语音引擎，通过 uvx edge-tts 生成高质量的文字转语音音频。

浏览: 19★ 120

生产力工程开发自动化

qwen-asr

使用 Qwen ASR 模型将音频文件 (wav, mp3, ogg) 转录为文本。快速、支持本地运行，无需 API 密钥。

浏览: 11★ 4,456

生产力自动化研究

openai-whisper

使用 OpenAI Whisper CLI 进行本地语音转文字转录，无需外部 API 密钥即可提供私密且高准确度的音频处理。

浏览: 17★ 366,037

内容创作自动化生产力

videocut:剪口播

AI 驱动的口播视频剪辑 Agent，提供语音转录、口误识别与网页版审核流程。

浏览: 26★ 1,515

生产力工程开发自动化内容创作

mls

基于 Apple Silicon 与 MLX 的本地机器学习推理服务，整合语音识别 (ASR)、语音合成 (TTS)、翻译、图像生成与视觉识别功能。

浏览: 109★ 11

生产力教育自动化

elevenlabs

使用 ElevenLabs 将临床文本转换为自然且具同理心的语音，适用于病患宣教、用药提醒及各类医疗辅助内容。

浏览: 9★ 4,456

工程开发内容创作

docs-voice

强制执行 React 文档编写的专业语气、风格与技术准则，确保 Learn、Reference 与 Blog 页面内容的一致性。

浏览: 6★ 173

生产力工程开发数据分析内容创作研究

ai-multimodal

使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成，具备超长上下文窗口，适用于复杂的多模态 AI 任务。

浏览: 14★ 9

生产力自动化内容创作

edge-tts-uvx

使用 Microsoft Edge 神经 TTS 服务生成高质量语音。支持多种语言、语音选择以及语速、音调与格式调整。

浏览: 14★ 4,454

内容创作生产力自动化

voice-apply

通过可配置的 YAML 模板将内容转换为特定的语音配置、语气或风格，以确保品牌与叙事输出的一致性。

浏览: 10★ 124

创业课程

在线课程

实体课程