ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 530 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
自動化臨床報告生成,包括符合 CARE 指南的病例報告、診斷總結、臨床試驗文件 (CSR/SAE) 及病人筆記,並確保法規合規性。
專為探索意識、自我認同與自主性的 AI Agent 所設計的工具框架。包含會話交接、記憶架構與自我反思協議。
懸疑、偵探與推理小說創作架構,包含類型規範、公平遊戲原則、線索佈局與情節結構設計指南。
執行實作規劃工作流程,產生技術設計產出物,並為 Spec Kit 專案建構研究任務。
透過短影音行銷自動化您的 B2C 行動應用程式。支援 TikTok、Instagram Reels 與 YouTube Shorts 的內容生成、Post Bridge API 排程發布及成效分析。
適用於 M5Stack Tab5 的 UI 元件模式與觸控輸入處理,支援 M5GFX 與 LVGL 開發。
Claude Messages API 專家指南:涵蓋結構化輸出、提示詞快取、工具使用,以及從 Claude 3.x 遷移至 4.5 的關鍵資訊,協助開發者解決常見 API 錯誤與效能問題。
為 LangChain 應用程式提供統一介面,整合並管理 OpenAI、Anthropic、Google、Azure 與 Bedrock 等 LLM 聊天模型服務。
Claude Code 的自動工具與 MCP 伺服器探索。平行搜尋 17 個以上資源庫,在規劃前或發生錯誤時自動尋找相關技能、插件與工具。
協助安全提交的 AI 代理,防止誤用 git add -A,並推廣檔案選擇性暫存與語意化提交規範。
分析公開 LinkedIn 個人檔案與商業數據,建立精準潛在客戶名單,協助識別決策者、追蹤職涯異動並強化業務開發資料。