ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 411 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
分析本機硬體 (RAM, CPU, GPU/VRAM) 並獲取最佳化的本機 LLM 模型推薦、量化設定與效能預估。
適用於原生 iOS 與 macOS 開發的 SwiftUI 架構與實作模式,專注於狀態管理、視圖組合與數據持久化。
使用百度 AI 搜尋引擎 (BDSE) 進行即時網路搜尋,獲取最新資訊、文件與研究資料。
使用 Snowflake CLI 建立、修改及驗證 Snowflake 語意視圖。
透過 Turing Tavily 代理進行即時網頁搜尋。適用於查找最新資訊、研究時事、以及獲取訓練資料庫以外的即時數據。
LangGraph 專家技能,專為構建具狀態、多角色 AI 代理工作流而設計,包含持久化、條件分支與 ReAct 模式。
Python 編碼助手,提供最佳實踐、PEP 8 風格檢查、使用 pytest 自動化測試以及 uv 依賴管理。
實作安全的後端驗證 (JWT, OAuth, Sessions) 與授權 (RBAC, ABAC) 模式,包含密碼雜湊、多因素驗證 (MFA) 及安全最佳實踐。
建立並執行基於狀態機的自動化流程,支援人機協作,適用於複雜的多步驟商業處理。
使用 Design Graph 方法論構建連貫且基於約束的設計系統。自動化設計令牌、排版比例、元件、變體及主題的創建過程。
基於 LangGraph 與 Claude Opus 4.5 的自動化 LinkedIn 內容行銷多代理系統,涵蓋趨勢研究、內容生成、個人品牌語氣分析與成效追蹤。