nano-banana-pro

简介

nano-banana-pro 技能为开发人员和创作者提供了一个简化的接口，以便在终端工作流程中直接利用 Google 先进的 gemini-3-pro-image-preview 模型。此工具旨在缩小复杂多模态生成式 AI 与实际文件操作之间的差距。通过 uv 自动执行 Python 脚本，它能实现从照片级真实图像到需要 Google 搜索地面真实性 (grounding) 的数据准确信息图表等各类高质量资产的创作。对于需要即时生成图表、插图，或执行风格转换、构图调整及特定主题转换等迭代图像编辑任务的用户来说，该工具特别有效。

使用 gemini-3-pro-image-preview 模型进行进阶图像生成，支持从 1:1 到 21:9 的多种长宽比。
利用实时 Google 搜索地面真实性功能创作数据准确的信息图表，确保视觉信息符合事实。
多模态图像编辑与转换能力，允许用户提供输入图像作为风格或结构修改的参考。
在生成的视觉效果中进行高保真文字渲染，非常适合制作图表、本地化营销素材及带有注释的统计图表。
可设定输出参数，包含 1K、2K 及 4K 分辨率选项，以符合特定项目需求。
通过 uv 管理的高效脚本执行环境，确保所有依赖项皆能自动处理，无需手动设置环境。
需要从 Google AI Studio 获取有效的 GEMINI_API_KEY 环境变量进行身份验证。
接受文本提示作为主要输入，并可通过参数提供图像文件路径，用于上下文感知转换或基于参考的生成。
输出通常会以图像文件（如 PNG、JPG）格式保存至用户指定的路径，提供项目组织的灵活性。
最适合用于开发或研究周期中，需要快速视觉原型设计、数据视觉化或创意设计资产的场景。
用户在执行时需确保输入的图像路径可被本地 Shell 环境访问，以确保处理流程顺畅。

创业课程

在线课程

实体课程

简介

仓库统计