ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 176 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
使用 Gas Town 的車隊系統 (convoy) 管理批次任務追蹤與排程,實現多代理自動化協作。
一個專為模擬提示詞注入攻擊並驗證 AI 代理技能安全掃描器而設計的測試工具。
使用 Syft 為容器映像檔與檔案系統產生軟體物料清單 (SBOM)。支援 28 種以上生態系、多種格式 (CycloneDX, SPDX),並可整合至 CI/CD 以強化供應鏈安全。
為構建 Claude API 生產級應用提供專家指導,涵蓋 SDK 使用、提示詞緩存、批量處理、串流傳輸、工具調用及成本優化策略。
用於 Ruflo/Claude Flow 生態系統的多代理管線、資料轉換與順序工作流程的 Stream-JSON 串聯工具。
自動化每日米蘭新聞簡報工具,整合天氣、罷工資訊、國際/AI/義大利新聞及活動抓取。支援 SQLite 去重、RSS/API 源管理與 AI Agent 排程調度。
產生逼真的虛擬產品試穿視覺效果,協助客戶在購買前評估版型、垂墜感與尺寸比例。
防止 AI 幻覺,確保在分析程式碼、技術文件或提供建議時,輸出具備證據支持且可驗證的內容。
為研究、開發與測試工作流部署網格、層級與星狀拓撲等進階多代理人蜂群編排策略。
一個智慧閘道,可分析、評分並將使用者請求路由至 27 個代理、27 個技能與 14 個 MCP,以優化 Claude Code 的執行效率。
提供識別、審查與管理由 GitHub Copilot 編碼代理在儲存庫中建立之提取請求 (PR) 的操作指南與技巧。