ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 628 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
實作 Linkerd 服務網格模式,用於 Kubernetes 環境中的安全性、流量策略管理與零信任網路部署。
分析 AppWorld 任務失敗原因,提取具體的 API 模式並生成帶有實作程式碼範例的可執行劇本要點。
透過 iTunes Search API 搜尋、瀏覽並下載 Apple Podcasts 節目。適用於音訊內容存檔、批次下載以及獲取豐富的元數據,適合研究需求或個人媒體庫管理。
透過 Telegram 或命令行自動發布 Instagram 貼文。支援住宅代理繞過檢測、會話快取,並整合 WaveSpeed 影像生成。
PyTorch Lightning 深度學習框架技能:自動化模型訓練、多 GPU 編排、數據管道以及 DDP、FSDP 和 DeepSpeed 等分散式訓練策略。
快速查詢 SaaS 財務指標、公式與基準。透過即時存取定義、決策框架與異常警示指標,提升您的財務分析效率。
使用 AI 自動化技術,將 CSV 或 JSON 資料轉換為適合學術出版的高品質統計圖表。
為複雜軟體專案建立強健、可擴展且易於維護的技術實作計畫。
應用六頂思考帽方法論於軟體測試,進行結構化與全面的品質分析、測試策略設計以及團隊討論。
為 Peon Trainer 記錄伏地挺身、深蹲等健身次數。透過 AI 代理直接記錄運動進度,觸發音效提示,讓您在編碼時保持動力。
用於 Svelte 5 文件查詢與代碼分析的 CLI 工具。透過即時文件檢索與自動修復功能,優化 Svelte 組件的開發、除錯與檢查流程。