nano-banana-pro

簡介

nano-banana-pro 技能為開發人員和創作者提供了一個簡化的介面，以便在終端機工作流程中直接利用 Google 先進的 gemini-3-pro-image-preview 模型。此工具旨在縮小複雜多模態生成式 AI 與實際檔案操作之間的差距。透過 uv 自動執行 Python 指令碼，它能實現從照片級真實影像到需要 Google 搜尋地面真實性 (grounding) 的數據準確資訊圖表等各類高品質資產的創作。對於需要即時生成圖表、插圖，或執行風格轉換、構圖調整及特定主題轉換等迭代影像編輯任務的使用者來說，該工具特別有效。

使用 gemini-3-pro-image-preview 模型進行進階影像生成，支援從 1:1 到 21:9 的多種長寬比。
利用即時 Google 搜尋地面真實性功能創作數據準確的資訊圖表，確保視覺資訊符合事實。
多模態影像編輯與轉換能力，允許使用者提供輸入影像作為風格或結構修改的參考。
在生成的視覺效果中進行高保真文字渲染，非常適合製作圖表、在地化行銷素材及帶有註釋的統計圖表。
可設定輸出參數，包含 1K、2K 及 4K 解析度選項，以符合特定專案需求。
透過 uv 管理的高效腳本執行環境，確保所有依賴項皆能自動處理，無需手動設定環境。
需要從 Google AI Studio 取得有效的 GEMINI_API_KEY 環境變數進行身份驗證。
接受文字提示作為主要輸入，並可透過參數提供影像檔案路徑，用於上下文感知轉換或基於參考的生成。
輸出通常會以影像檔案（如 PNG、JPG）格式儲存至使用者指定的路徑，提供專案組織的靈活性。
最適合用於開發或研究週期中，需要快速視覺原型設計、數據視覺化或創意設計資產的場景。
使用者在執行時需確保輸入的影像路徑可被本地 Shell 環境存取，以確保處理流程順暢。

創業課程

網上課程

實體課程

簡介

倉庫統計