openai-whisper
使用 OpenAI Whisper CLI 進行本地語音轉文字轉錄,無需外部 API 金鑰即可提供私密且高準確度的音訊處理。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 171 個技能
使用 OpenAI Whisper CLI 進行本地語音轉文字轉錄,無需外部 API 金鑰即可提供私密且高準確度的音訊處理。
實作 Google Gemini API 影像分析功能,包含圖片標註、物件偵測、圖像分割、視覺問答及多圖比較分析。
使用此基於 API 的工具自動化管理 GitLab 儲存庫。透過 AI 代理直接執行檔案操作、分支管理與專案追蹤。
全方位的 PDF 處理工具包,支援文字與表格提取、文件合併/分割、旋轉以及 PDF 文件自動化生成與填寫,提供 Python 與命令列工具整合。
將 Markdown 無縫發佈至飛書文檔。支援自動表格轉換、權限管理與批量寫入功能,提升協作效率。
全方位辦公生產力 AI 代理工具包,支援 PDF、Word、Excel、PowerPoint 文件處理及內部溝通自動化。
從沙盒環境遠端控制無頭瀏覽器,進行自動化網頁瀏覽、資料擷取、表單互動及測試工作。
功能全面的 PowerPoint 簡報管理工具,支援 .pptx 檔案的建立、編輯、文字提取、模板套用以及視覺化分析。
從網際網路擷取、下載並批次處理各種格式(JPG, PNG, WebP, SVG 等)的圖片,適用於嵌入文件、網頁存檔或聊天應用。
使用 rclone 在本機儲存與雲端供應商(如 S3、Cloudflare R2、Backblaze B2、Google Drive 和 Dropbox)之間管理、同步與傳輸檔案。
透過 Telegram 或命令行自動發布 Instagram 貼文。支援住宅代理繞過檢測、會話快取,並整合 WaveSpeed 影像生成。
一個模組化的數據處理工具,用於清理、驗證和分析 CSV 檔案,支援自定義轉換及自動化依賴管理。