gemini-api
Google Gemini 影像生成 API 介面,支援文字轉影像、影像編輯、風格模板與自動重試工作流程。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 121 個技能
Google Gemini 影像生成 API 介面,支援文字轉影像、影像編輯、風格模板與自動重試工作流程。
專門用於實作 Gemini Interactions API 的技能。適用於狀態化多輪對話、背景 Deep Research 代理任務、函數呼叫、結構化輸出,以及現代 Python 與 TypeScript SDK 的整合。
Gemini AI 指令列介面,支援單次 Prompt 執行、內容生成,以及為 OpenClaw 使用者提供 JSON 格式的資料提取功能。
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
實作 Google Gemini API 影像分析功能,包含圖片標註、物件偵測、圖像分割、視覺問答及多圖比較分析。
使用 Google Gemini 3 Pro 模型生成與編輯圖像、圖表和資訊圖表。支援文字轉圖像、風格轉換及數據準確的視覺化創作。
將 Claude Code 作為架構師使用:將所有編碼與檔案編輯工作委派給 Gemini CLI,同時透過規劃、驗證與監督來掌控開發流程。
透過 nanaban CLI 使用 Gemini API 生成與編輯影像。適用於製作插圖、標誌、圖示,以及執行背景移除、風格轉換等照片編輯任務。
使用 Google Gemini API 生成 3D 城市美食盲盒影像。創作包含標誌性美食、文化符號與城市歷史元素的四宮格立體模型風格圖像。
使用 Nano Banana Pro (Gemini 3 Pro) AI 模型生成應用程式圖示、Logo、行銷橫幅及各類插圖等專業視覺素材。
使用 AI 自動化技術,將 CSV 或 JSON 資料轉換為適合學術出版的高品質統計圖表。