工程開發
gemini-api
Google Gemini 影像生成 API 介面,支援文字轉影像、影像編輯、風格模板與自動重試工作流程。
簡介
Gemini API 技能為 Google 先進影像生成模型提供了一個流暢的互動介面,專為高效率生產工作流程進行了最佳化。開發人員可以直接透過命令列介面生成、編輯影像並進行迭代。透過整合 gemini-3-pro-image-preview 與 gemini-2.5-flash-image 等模型,此技能在 4K 高畫質輸出與快速原型迭代之間取得了平衡。它專為需要以程式控制影像生成且不想增加額外手動負擔的工程師與設計師所設計,確保視覺內容生成能成為軟體交付流程中可擴展的一部分。
-
支援文字轉影像生成,提供從社群媒體標準 1:1 到電影級 21:9 的自訂長寬比。
-
具備影像編輯與風格套用功能,可使用參考影像來保持視覺的一致性。
-
先進的 CLI 旗標系統,允許對模型 ID、重試策略與風格模板進行細緻控制。
-
自動指數退避與重試機制,用於處理暫時性網路錯誤、速率限制 (429) 與伺服器逾時。
-
完整的錯誤處理機制,針對 API 金鑰問題、輸入驗證錯誤與內容政策限制進行分類,利於快速復原。
-
使用者必須提供有效的 GEMINI_API_KEY 環境變數來進行請求驗證。
-
若要獲得一致的風格輸出,請使用包含 --style 旗標與 Markdown 格式模板的功能。
-
建議結合批次處理使用,以便針對單一提示詞生成多個變體進行反覆精煉。
-
注意內容政策違規將觸發特定錯誤代碼,此時需要調整輸入的提示詞。
-
請監控重試邏輯(預設為 3 次),並針對高延遲或不穩定的網路環境調整 --max-retries 旗標。
-
非常適合用於自動化內容生成、UI 資產製作以及在 CI/CD 管道中進行行銷素材的快速原型開發。
倉庫統計
- Star 數
- 255
- Fork 數
- 31
- Open Issue 數
- 7
- 主要語言
- TypeScript
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年4月30日 上午08:36