ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 296 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
透過 Sosumi 服務獲取 Apple 平台開發文件、人機介面指南 (HIG) 與 WWDC 演講逐字稿的 Markdown 內容。
Supermemory 是 AI 代理的長期記憶基礎設施,提供持久上下文、用戶畫像及跨多模態知識庫的語義 RAG 搜尋功能。
AI 稅務顧問,為日本自由職業者與上班族提供 2025 年最新稅制、扣除額計算及節稅規劃的專業諮詢。
透過 CLI 與 MCP 使用 z.AI,提供影像分析、網頁搜尋、文件閱讀與 GitHub 程式碼探索功能。
為 Claude Code 提供的全方位 Next.js 15 開發與專案管理技能,包含 Supabase 整合、RBAC 權限管理及自動化品質驗證。
CLI 專用 iOS 開發代理,支援 Swift、SwiftUI 與 UIKit。完整覆蓋建置、除錯、測試與發佈生命週期,無需 Xcode。
基於 Exa AI 的神經網絡搜尋與程式碼上下文檢索。適用於技術文件查詢、程式碼範例搜尋、研究報告及企業資訊搜集。
獲取全球城市的天氣狀況、溫度、降雨預報及行程規劃資訊,協助您掌握即時氣候資訊。
AI 代理的執行前安全防護機制。針對 Shell 指令和檔案讀取執行 400 多種安全模式驗證,攔截具破壞性的操作、憑證竊取與未授權的系統存取。
建立高轉化率的銷售、產品發布與潛在客戶培養郵件序列。根據您的業務風格、受眾與行銷目標,自動生成專業的電子郵件行銷活動。
從網頁中提取 WebGL/Canvas/Shader 特效代碼,進行反混淆處理並移植為獨立的原生 JavaScript 專案。