工程开发
nano-banana-pro avatar

nano-banana-pro

使用 Google Gemini 3 Pro 模型生成与编辑图像、图表和信息图表。支持文本转图像、风格转换及数据准确的视觉化创作。

简介

nano-banana-pro 技能为开发人员和创作者提供了一个简化的接口,以便在终端工作流程中直接利用 Google 先进的 gemini-3-pro-image-preview 模型。此工具旨在缩小复杂多模态生成式 AI 与实际文件操作之间的差距。通过 uv 自动执行 Python 脚本,它能实现从照片级真实图像到需要 Google 搜索地面真实性 (grounding) 的数据准确信息图表等各类高质量资产的创作。对于需要即时生成图表、插图,或执行风格转换、构图调整及特定主题转换等迭代图像编辑任务的用户来说,该工具特别有效。

  • 使用 gemini-3-pro-image-preview 模型进行进阶图像生成,支持从 1:1 到 21:9 的多种长宽比。

  • 利用实时 Google 搜索地面真实性功能创作数据准确的信息图表,确保视觉信息符合事实。

  • 多模态图像编辑与转换能力,允许用户提供输入图像作为风格或结构修改的参考。

  • 在生成的视觉效果中进行高保真文字渲染,非常适合制作图表、本地化营销素材及带有注释的统计图表。

  • 可设定输出参数,包含 1K、2K 及 4K 分辨率选项,以符合特定项目需求。

  • 通过 uv 管理的高效脚本执行环境,确保所有依赖项皆能自动处理,无需手动设置环境。

  • 需要从 Google AI Studio 获取有效的 GEMINI_API_KEY 环境变量进行身份验证。

  • 接受文本提示作为主要输入,并可通过参数提供图像文件路径,用于上下文感知转换或基于参考的生成。

  • 输出通常会以图像文件(如 PNG、JPG)格式保存至用户指定的路径,提供项目组织的灵活性。

  • 最适合用于开发或研究周期中,需要快速视觉原型设计、数据视觉化或创意设计资产的场景。

  • 用户在执行时需确保输入的图像路径可被本地 Shell 环境访问,以确保处理流程顺畅。

仓库统计

Star 数
7
Fork 数
1
Open Issue 数
0
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年5月3日 02:25
在 GitHub 查看