gemini-api
Google Gemini 图像生成 API 接口,支持文本转图像、图像编辑、风格模板与自动重试工作流程。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 121 个技能
Google Gemini 图像生成 API 接口,支持文本转图像、图像编辑、风格模板与自动重试工作流程。
专门用于实现 Gemini Interactions API 的技能。适用于状态化多轮对话、后台 Deep Research 代理任务、函数调用、结构化输出,以及现代 Python 与 TypeScript SDK 的整合。
Gemini AI 命令行接口,支持单次 Prompt 执行、内容生成,以及为 OpenClaw 用户提供 JSON 格式的数据提取功能。
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
整合 Google Gemini API 音频处理功能:进行录音转文字、音频摘要、声音分析,并提供语音合成 (TTS) 功能以产生自然语音。
实现 Google Gemini API 图像分析功能,包含图像描述、对象检测、图像分割、视觉问答及多图对比分析。
使用 Google Gemini 3 Pro 模型生成与编辑图像、图表和信息图表。支持文本转图像、风格转换及数据准确的视觉化创作。
将 Claude Code 作为架构师使用:将所有编码与文件编辑工作委派给 Gemini CLI,同时通过规划、验证与监督来掌控开发流程。
通过 nanaban CLI 使用 Gemini API 生成与编辑图像。适用于制作插图、标志、图标,以及执行背景移除、风格转换等照片编辑任务。
使用 Google Gemini API 生成 3D 城市美食盲盒影像。创作包含标志性美食、文化符号与城市历史元素的四宫格立体模型风格图像。
使用 Nano Banana Pro (Gemini 3 Pro) AI 模型生成应用图标、Logo、营销横幅及各类插图等专业视觉素材。
使用 AI 自动化技术,将 CSV 或 JSON 数据转换为适合学术出版的高质量统计图表。