gemini
Gemini AI 指令列介面,支援單次 Prompt 執行、內容生成,以及為 OpenClaw 使用者提供 JSON 格式的資料提取功能。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 150 個技能
Gemini AI 指令列介面,支援單次 Prompt 執行、內容生成,以及為 OpenClaw 使用者提供 JSON 格式的資料提取功能。
實作 Google Gemini API 影像分析功能,包含圖片標註、物件偵測、圖像分割、視覺問答及多圖比較分析。
使用 Google Gemini API 進行深度影片分析:包含影片摘要、音訊轉錄、時間戳記提取、影片片段剪輯,並支援 YouTube 連結或本機檔案,適用於多種模型與長文本脈絡。
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
基於 Gemini 的 UI 設計審核、無障礙審計與設計系統驗證工具,專為軟體代理設計。
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
透過 nanaban CLI 使用 Gemini API 生成與編輯影像。適用於製作插圖、標誌、圖示,以及執行背景移除、風格轉換等照片編輯任務。
Google Gemini 影像生成 API 介面,支援文字轉影像、影像編輯、風格模板與自動重試工作流程。
將 Claude Code 作為架構師使用:將所有編碼與檔案編輯工作委派給 Gemini CLI,同時透過規劃、驗證與監督來掌控開發流程。
專門用於實作 Gemini Interactions API 的技能。適用於狀態化多輪對話、背景 Deep Research 代理任務、函數呼叫、結構化輸出,以及現代 Python 與 TypeScript SDK 的整合。
使用 Google Gemini 3 Pro 模型生成與編輯圖像、圖表和資訊圖表。支援文字轉圖像、風格轉換及數據準確的視覺化創作。
專業 Gemini CLI 技能架構師:專門用於構建新技能、將 Claude Code 工具轉換為 Gemini 格式,以及重構與優化現有的 CLI 編排器。