生產力工程開發資料分析內容創作研究
ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
瀏覽: 14★ 9
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 113 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
使用結構化 JSON 提示詞與自動化 Python 腳本生成高品質的圖像、角色與場景,支援參考圖像以進行精確的視覺創作。
提升影像品質、解析度與清晰度,專為螢幕截圖與數位媒體設計。適用於專業文件、部落格與簡報。
運用系統化設計原則、AI 評估與自動化靈感分析,打造美觀的用戶介面。
實作 Google Gemini API 影像分析功能,包含圖片標註、物件偵測、圖像分割、視覺問答及多圖比較分析。
使用電腦視覺相似度嵌入技術,在 FiftyOne 資料集中尋找、檢視並移除重複或高度相似的圖像。
使用 AI 生成專業 PowerPoint 簡報。透過 Gemini 強大的敘事規劃與圖像生成功能,從主題提示詞直接建立全版高解析度投影片。
基於 Gemini 的 UI 設計審核、無障礙審計與設計系統驗證工具,專為軟體代理設計。
建立專業且可編輯的 PowerPoint (.pptx) 簡報,具備 AI 生成的全版投影片圖像、品牌一致性與風格參考功能。
為 Enzo 設計的自動化截圖轉知識工作流。從截圖中捕捉、分類、提取內容並記錄模式,構建結構化的參考庫。
AI 食物熱量與營養計算器。透過視覺識別辨識餐點,自動計算卡路里及營養素,並結合內建營養資料庫提供健康建議。
透過本地 ComfyUI 實例生成高品質圖像。適合需要隱私保護、專業 AI 圖像合成與自訂工作流的開發者。