nano-banana-pro
使用 Google Gemini 3 Pro 模型生成與編輯圖像、圖表和資訊圖表。支援文字轉圖像、風格轉換及數據準確的視覺化創作。
簡介
nano-banana-pro 技能為開發人員和創作者提供了一個簡化的介面,以便在終端機工作流程中直接利用 Google 先進的 gemini-3-pro-image-preview 模型。此工具旨在縮小複雜多模態生成式 AI 與實際檔案操作之間的差距。透過 uv 自動執行 Python 指令碼,它能實現從照片級真實影像到需要 Google 搜尋地面真實性 (grounding) 的數據準確資訊圖表等各類高品質資產的創作。對於需要即時生成圖表、插圖,或執行風格轉換、構圖調整及特定主題轉換等迭代影像編輯任務的使用者來說,該工具特別有效。
-
使用 gemini-3-pro-image-preview 模型進行進階影像生成,支援從 1:1 到 21:9 的多種長寬比。
-
利用即時 Google 搜尋地面真實性功能創作數據準確的資訊圖表,確保視覺資訊符合事實。
-
多模態影像編輯與轉換能力,允許使用者提供輸入影像作為風格或結構修改的參考。
-
在生成的視覺效果中進行高保真文字渲染,非常適合製作圖表、在地化行銷素材及帶有註釋的統計圖表。
-
可設定輸出參數,包含 1K、2K 及 4K 解析度選項,以符合特定專案需求。
-
透過 uv 管理的高效腳本執行環境,確保所有依賴項皆能自動處理,無需手動設定環境。
-
需要從 Google AI Studio 取得有效的 GEMINI_API_KEY 環境變數進行身份驗證。
-
接受文字提示作為主要輸入,並可透過參數提供影像檔案路徑,用於上下文感知轉換或基於參考的生成。
-
輸出通常會以影像檔案(如 PNG、JPG)格式儲存至使用者指定的路徑,提供專案組織的靈活性。
-
最適合用於開發或研究週期中,需要快速視覺原型設計、數據視覺化或創意設計資產的場景。
-
使用者在執行時需確保輸入的影像路徑可被本地 Shell 環境存取,以確保處理流程順暢。
倉庫統計
- Star 數
- 7
- Fork 數
- 1
- Open Issue 數
- 0
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年5月3日 上午02:25