speak
使用 Kokoro TTS 進行本地文字轉語音。在終端機中生成語音、朗讀文字並處理多語言語音合成。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 103 個技能
使用 Kokoro TTS 進行本地文字轉語音。在終端機中生成語音、朗讀文字並處理多語言語音合成。
專業 Kokoro TTS 語音合成技能,專為 JARVIS 風格助手打造,提供離線、即時、安全的語音輸出。包含串流合成、韻律控制及效能最佳化的音訊生成功能。
使用 Microsoft Edge 神經語音引擎,透過 uvx edge-tts 產生高品質的文字轉語音音訊。
使用 Qwen ASR 模型將音訊檔案 (wav, mp3, ogg) 轉錄為文字。快速、易於本地部署且無需 API 金鑰。
使用 OpenAI Whisper CLI 進行本地語音轉文字轉錄,無需外部 API 金鑰即可提供私密且高準確度的音訊處理。
AI 驅動的口播影片剪輯 Agent,提供語音轉錄、口誤偵測與網頁版審核流程。
基於 Apple Silicon 與 MLX 的本地機器學習推論服務,整合語音識別 (ASR)、語音合成 (TTS)、翻譯、圖像生成與視覺識別功能。
使用 ElevenLabs 將臨床文本轉換為自然且具同理心的語音,適用於病患衛教、服藥提醒及各類醫療輔助內容。
強制執行 React 文件編寫的專業語氣、風格與技術準則,確保 Learn、Reference 與 Blog 頁面內容的一致性。
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
使用 Microsoft Edge 神經 TTS 服務生成高品質語音。支援多種語言、語音選擇以及語速、音調與格式調整。
透過可配置的 YAML 模板將內容轉換為特定的語音配置、語氣或風格,以確保品牌與敘事輸出的一致性。