nano-banana-pro
使用 Google Gemini 3 Pro 模型生成与编辑图像、图表和信息图表。支持文本转图像、风格转换及数据准确的视觉化创作。
简介
nano-banana-pro 技能为开发人员和创作者提供了一个简化的接口,以便在终端工作流程中直接利用 Google 先进的 gemini-3-pro-image-preview 模型。此工具旨在缩小复杂多模态生成式 AI 与实际文件操作之间的差距。通过 uv 自动执行 Python 脚本,它能实现从照片级真实图像到需要 Google 搜索地面真实性 (grounding) 的数据准确信息图表等各类高质量资产的创作。对于需要即时生成图表、插图,或执行风格转换、构图调整及特定主题转换等迭代图像编辑任务的用户来说,该工具特别有效。
-
使用 gemini-3-pro-image-preview 模型进行进阶图像生成,支持从 1:1 到 21:9 的多种长宽比。
-
利用实时 Google 搜索地面真实性功能创作数据准确的信息图表,确保视觉信息符合事实。
-
多模态图像编辑与转换能力,允许用户提供输入图像作为风格或结构修改的参考。
-
在生成的视觉效果中进行高保真文字渲染,非常适合制作图表、本地化营销素材及带有注释的统计图表。
-
可设定输出参数,包含 1K、2K 及 4K 分辨率选项,以符合特定项目需求。
-
通过 uv 管理的高效脚本执行环境,确保所有依赖项皆能自动处理,无需手动设置环境。
-
需要从 Google AI Studio 获取有效的 GEMINI_API_KEY 环境变量进行身份验证。
-
接受文本提示作为主要输入,并可通过参数提供图像文件路径,用于上下文感知转换或基于参考的生成。
-
输出通常会以图像文件(如 PNG、JPG)格式保存至用户指定的路径,提供项目组织的灵活性。
-
最适合用于开发或研究周期中,需要快速视觉原型设计、数据视觉化或创意设计资产的场景。
-
用户在执行时需确保输入的图像路径可被本地 Shell 环境访问,以确保处理流程顺畅。
仓库统计
- Star 数
- 7
- Fork 数
- 1
- Open Issue 数
- 0
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 02:25