gemini-audio
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 171 個技能
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
透過 CLI 提交 OpenAnt 完成的任務。支援文字報告、檔案上傳(圖片、文件、程式碼)及外部證明連結,確保交付成果可被驗證。
使用 DuckDB 讀取並分析任何資料檔案 (CSV, JSON, Parquet, Avro, Excel 等) 或遠端連結 (S3, HTTPS)。自動偵測檔案格式並進行資料概覽與分析。
為 Kirby CMS 實作前端表單與動作,包含聯絡表單、檔案上傳、郵件處理以及從前端建立頁面等功能。
為 Enzo 設計的自動化截圖轉知識工作流。從截圖中捕捉、分類、提取內容並記錄模式,構建結構化的參考庫。
使用 yt-dlp 將 YouTube 影片下載至您的 ~/Downloads 資料夾。支援高畫質影音提取。
透過 MCP 伺服器直接建立新的 Figma 設計或 FigJam 檔案。自動處理計畫解析並為您的設計工作流程初始化畫布。
實作類似 Manus 的持久化 Markdown 規劃流程,用於複雜的工作流、專案追蹤與研究管理,優化 AI 代理的注意力與記憶效能。
透過您的助理直接管理飛書雲端儲存空間的檔案、資料夾與文件。
全方位的電子郵件管理與自動化工具。支援多種郵件供應商,可進行發送、接收、附件處理及郵件整理。
自動化 Convex 靜態網站託管整合,管理 React、Vite 與 Next.js 應用的上傳 API、HTTP 路由及部署腳本。
利用 ripgrep 進行快速文字搜尋,並透過 ast-grep 進行語法感知代碼分析,有效定位程式碼庫中的模式與結構。