ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 517 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
Sage MCP 協議實現,用於整合外部工具伺服器與標準化 AI 模型上下文。
透過 PubMed、arXiv 和 Semantic Scholar 進行系統性文獻回顧,包含人工智慧驅動的綜述、核實引用以及強制性的科學圖表生成。
A股收盤後深度分析工具,利用多 Agent 平行架構、AkShare 行情數據與 Tavily 新聞,自動生成三文魚粉風格(FT-style)的交互式 HTML 日報。
自動化 Moonwell 協議治理提案生命週期,從建立、驗證到部署與測試。
透過 sssinstagram.com 下載 Instagram Reels,並自動處理為適合 WhatsApp 分享的影片格式。
llmemory 文件儲存與搜尋入門:涵蓋安裝、pgvector 資料庫設定、文件導入、混合/語義檢索,以及具備多租戶支援的 RAG 系統建構。
診斷並解決 Dojo.js 應用程式中的連線、同步、訂閱及型別問題。用於排解 Torii、實體查詢和狀態更新故障。
為 Enzo 設計的自動化截圖轉知識工作流。從截圖中捕捉、分類、提取內容並記錄模式,構建結構化的參考庫。
即時 AI 新聞簡報工具。針對任何主題進行即時網路搜尋,獲取中文摘要與深度洞察,並透過飛書傳送專業簡報卡片。
智慧型合約審閱工具,可識別風險、提取關鍵條款並標記異常條款,協助您做出明智決策。
透過結構化的自我評估檢查點,確保 AI 在任務執行前、中、後的方案驗證與風險控管,提升程式開發品質。