ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 187 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
使用 FastMCP 框架建構與管理 MCP 伺服器。提供工具開發、資源配置、Prompt 設計、Claude Desktop 整合及 Python/TypeScript 部署指南。
透過 Python 程式碼執行來高效率地搜尋您的 Zotero 文獻庫。實現全面性的多策略查詢、自動去重與關聯性排序,有效避免內容溢出或系統崩潰。
透過反向工程優質 GitHub 專案與開源方法論,建立高效能 AI 技能。
🛡️ GDPR 與 LGPD 隱私守護者:自動化合規掃描工具,可偵測程式碼中的個人識別資訊 (PII) 外洩、不安全日誌與追蹤違規,協助預防監管罰款。
基於 Model Context Protocol 的 AI 瀏覽器自動化伺服器,支援網頁互動、數據提取與深度研究。
爬取網站並將內容儲存為乾淨的 Markdown 檔案。適用於文件擷取、研究分析與離線知識庫建立。
使用 AgentDB 的超快速向量後端實作 ReasoningBank 自適應學習。具備軌跡追蹤、判斷評估、記憶蒸餾與模式識別功能,適用於構建自我學習的自主智能體。
為 AI 代理提供專家級 CLI 指南,涵蓋雲端、IaC、容器、資料庫與開發工具的資深工程師工作流程、安全防護與運作模式。
使用 Token Surgeon 審核並優化您的 AI 提示詞。偵測 10 種常見的冗餘模式,計算效率分數,並減少 Token 用量以提升提示詞效能。
透過 CLI 管理 Higress AI Gateway 的自動模型路由。根據請求內容設定觸發規則,實現智慧模型選擇。
一個系統化的多角度網頁研究代理。適用於深度調查、複雜問題查詢,以及在內容生成前作為強制性的研究步驟,確保獲得有據可查的高質量結果。