內容創作
baoyu-image-gen avatar

baoyu-image-gen

基於 API 的 AI 圖像生成工具,支援 OpenAI、Azure、Google、OpenRouter、DashScope、Replicate 等多個模型。提供文字生成圖像、參考圖引導、比例控制及批次處理功能。

簡介

baoyu-image-gen 技能為專業級 AI 圖像生成提供統一的介面。它作為使用者提示與各類商業圖像模型之間的橋樑,讓創作者與工程師無需處理複雜的個別 SDK,即可調用包括 OpenAI DALL-E、Azure OpenAI、Google Imagen、OpenRouter、DashScope (通義萬象)、Z.AI、MiniMax、即夢 (Jimeng)、豆包 (Seedream) 及 Replicate 等頂級 API。該工具專為快速單張影像原型設計與高吞吐量的批次生產而優化。

  • 多供應商支援:透過命令列參數或專案設定檔,輕鬆切換不同的專門模型。

  • 進階提示處理:支援純文字輸入、讀取提示檔案,並可合併多個檔案以達成複雜的構圖需求。

  • 精準參數控制:原生支援比例調整 (如 16:9, 1:1)、高品質預設值、明確尺寸指定及參考圖引導生成。

  • 批次處理能力:內建具備並發控制的執行邏輯,非常適合大規模製作行銷素材或數據集生成。

  • 設定管理:實作分層設定系統 (專案/XDG/使用者),安全地管理 API 金鑰與預設模型參數。

  • 先決條件:執行時需安裝 Bun 執行環境以獲得最佳效能。

  • 設定規範:系統要求在生成前必須透過 EXTEND.md 完成初始設定,包含服務提供商憑證、預設模型與品質預設值。

  • 使用限制:請確保已正確設定對應服務商的環境變數 (例如 OPENAI_API_KEY, ARK_API_KEY, REPLICATE_API_TOKEN)。

  • 工作流建議:利用 --promptfiles 進行自動化批次處理,並使用 --ref 為支援多模態生成的模型提供視覺上下文。

  • 整合性:專為 AI 代理工作流設計,可將自然語言意圖 (如生成、建立、繪製) 轉換為精確的圖像生成參數。

倉庫統計

Star 數
16,787
Fork 數
1,958
Open Issue 數
1
主要語言
TypeScript
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月29日 下午01:00
在 GitHub 查看