ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 562 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
0 Finance 自動化 AI 電子郵件工作流程,協助 AI 代理管理發票、銀行轉帳及財務對話。
使用 Flow Nexus 平台在分佈式 E2B 沙盒中訓練與管理神經網路,支援 Transformer、LSTM 和 GAN 等自定義架構。
產生逼真的虛擬產品試穿視覺效果,協助客戶在購買前評估版型、垂墜感與尺寸比例。
專為中文社交媒體設計的內容生成器,支援小紅書、知乎、微信公眾號及抖音,提供平台原生格式與排版。
透過管理 conductor/ 目錄中的專案環境工件(產品、技術棧、工作流程、追蹤)來標準化開發環境。支援專案鷹架建立、工件同步以及針對全新與既有專案的 AI 對齊。
自動化生成 App Store「最新內容」版本說明,透過分析上次版本號更新以來的 Git 提交記錄來編寫發布資訊。
將軟體開發想法捕捉並形式化為 Hashbrown 存儲庫中的結構化設計文檔,包含研究資料與概念草圖。
為您的專案發想創意網域名稱,並即時檢查 .com, .io, .ai 等多種頂級網域的可用性,簡化您的品牌命名流程。
一個用於大語言模型代理生存記憶的微世界作業系統,將檔案系統轉化為可導航的房間,並將程式碼轉化為可居住的世界。
設計與構建高品質 AI Agent Skills 的專家顧問。透過發現、架構與製作階段的結構化引導,確保您建立的技能具備高度一致性、可組合性與執行效能。
為 Claude Code 設計的蜂巢思維多代理協作系統,具備女王式架構、拜占庭共識機制、持續性集體記憶與自適應任務分配,適用於複雜軟體開發。