gemini
Gemini AI 命令行接口,支持单次 Prompt 执行、内容生成,以及为 OpenClaw 用户提供 JSON 格式的数据提取功能。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 150 个技能
Gemini AI 命令行接口,支持单次 Prompt 执行、内容生成,以及为 OpenClaw 用户提供 JSON 格式的数据提取功能。
实现 Google Gemini API 图像分析功能,包含图像描述、对象检测、图像分割、视觉问答及多图对比分析。
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
整合 Google Gemini API 音频处理功能:进行录音转文字、音频摘要、声音分析,并提供语音合成 (TTS) 功能以产生自然语音。
基于 Gemini 的 UI 设计审核、无障碍审计与设计系统验证工具,专为软件代理设计。
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
通过 nanaban CLI 使用 Gemini API 生成与编辑图像。适用于制作插图、标志、图标,以及执行背景移除、风格转换等照片编辑任务。
Google Gemini 图像生成 API 接口,支持文本转图像、图像编辑、风格模板与自动重试工作流程。
将 Claude Code 作为架构师使用:将所有编码与文件编辑工作委派给 Gemini CLI,同时通过规划、验证与监督来掌控开发流程。
专门用于实现 Gemini Interactions API 的技能。适用于状态化多轮对话、后台 Deep Research 代理任务、函数调用、结构化输出,以及现代 Python 与 TypeScript SDK 的整合。
使用 Google Gemini 3 Pro 模型生成与编辑图像、图表和信息图表。支持文本转图像、风格转换及数据准确的视觉化创作。
专业 Gemini CLI 技能架构师:专门用于构建新技能、将 Claude Code 工具转换为 Gemini 格式,以及重构与优化现有的 CLI 编排器。