工程開發
nano-banana-pro avatar

nano-banana-pro

使用 Google Gemini 3 Pro 模型生成與編輯圖像、圖表和資訊圖表。支援文字轉圖像、風格轉換及數據準確的視覺化創作。

簡介

nano-banana-pro 技能為開發人員和創作者提供了一個簡化的介面,以便在終端機工作流程中直接利用 Google 先進的 gemini-3-pro-image-preview 模型。此工具旨在縮小複雜多模態生成式 AI 與實際檔案操作之間的差距。透過 uv 自動執行 Python 指令碼,它能實現從照片級真實影像到需要 Google 搜尋地面真實性 (grounding) 的數據準確資訊圖表等各類高品質資產的創作。對於需要即時生成圖表、插圖,或執行風格轉換、構圖調整及特定主題轉換等迭代影像編輯任務的使用者來說,該工具特別有效。

  • 使用 gemini-3-pro-image-preview 模型進行進階影像生成,支援從 1:1 到 21:9 的多種長寬比。

  • 利用即時 Google 搜尋地面真實性功能創作數據準確的資訊圖表,確保視覺資訊符合事實。

  • 多模態影像編輯與轉換能力,允許使用者提供輸入影像作為風格或結構修改的參考。

  • 在生成的視覺效果中進行高保真文字渲染,非常適合製作圖表、在地化行銷素材及帶有註釋的統計圖表。

  • 可設定輸出參數,包含 1K、2K 及 4K 解析度選項,以符合特定專案需求。

  • 透過 uv 管理的高效腳本執行環境,確保所有依賴項皆能自動處理,無需手動設定環境。

  • 需要從 Google AI Studio 取得有效的 GEMINI_API_KEY 環境變數進行身份驗證。

  • 接受文字提示作為主要輸入,並可透過參數提供影像檔案路徑,用於上下文感知轉換或基於參考的生成。

  • 輸出通常會以影像檔案(如 PNG、JPG)格式儲存至使用者指定的路徑,提供專案組織的靈活性。

  • 最適合用於開發或研究週期中,需要快速視覺原型設計、數據視覺化或創意設計資產的場景。

  • 使用者在執行時需確保輸入的影像路徑可被本地 Shell 環境存取,以確保處理流程順暢。

倉庫統計

Star 數
7
Fork 數
1
Open Issue 數
0
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月3日 上午02:25
在 GitHub 查看