ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 231 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
在獨立會話中執行實作計畫並進行審核檢查點,確保逐項任務驗證與代碼品質。
整合式 Tavily AI Python CLI 工具,支援網頁搜尋、內容擷取、網站爬蟲、結構映射以及自動化深度研究報告。
Anthropic Claude AI 模型,專用於高效編碼、長文本分析及 GUI 交互。
LobeHub 的 Linear 問題管理與同步工具,支援自動化 PR 關聯、子任務樹狀拆解與進度更新。
將資產從 EVM 鏈橋接至 Starknet,部署代理帳戶,並向 HuginnRegistry 註冊身份,以實現自主 AI 代理的入職流程。
一個用於 X/Twitter 的指令列介面,支援使用 Cookie 進行驗證的閱讀、搜尋、發文與社交互動,並整合於 OpenWhale AI 代理生態系統中。
基於 Qdrant 和 Ollama 的本地 RAG 語義記憶系統。適用於高效檢索工作區文件、筆記、決策記錄與用戶偏好,提供精確的向量語義搜索。
基於 Playwright 的完整瀏覽器自動化技能。具備自動檢測開發伺服器、產生測試腳本、螢幕截圖、表單填寫、響應式測試與使用者體驗驗證功能。
針對 PlantUML 序列圖的結構化批次處理、驗證與報表生成工具,適用於跨檔案維護。
設計與構建高品質 AI Agent Skills 的專家顧問。透過發現、架構與製作階段的結構化引導,確保您建立的技能具備高度一致性、可組合性與執行效能。
掌握動態規劃 (DP) 模式,包含備忘錄、表格化與狀態設計的完整實作,提供可應用於生產環境的解決方案。