簡介

baoyu-image-gen 技能為專業級 AI 圖像生成提供統一的介面。它作為使用者提示與各類商業圖像模型之間的橋樑，讓創作者與工程師無需處理複雜的個別 SDK，即可調用包括 OpenAI DALL-E、Azure OpenAI、Google Imagen、OpenRouter、DashScope (通義萬象)、Z.AI、MiniMax、即夢 (Jimeng)、豆包 (Seedream) 及 Replicate 等頂級 API。該工具專為快速單張影像原型設計與高吞吐量的批次生產而優化。

多供應商支援：透過命令列參數或專案設定檔，輕鬆切換不同的專門模型。
進階提示處理：支援純文字輸入、讀取提示檔案，並可合併多個檔案以達成複雜的構圖需求。
精準參數控制：原生支援比例調整 (如 16:9, 1:1)、高品質預設值、明確尺寸指定及參考圖引導生成。
批次處理能力：內建具備並發控制的執行邏輯，非常適合大規模製作行銷素材或數據集生成。
設定管理：實作分層設定系統 (專案/XDG/使用者)，安全地管理 API 金鑰與預設模型參數。
先決條件：執行時需安裝 Bun 執行環境以獲得最佳效能。
設定規範：系統要求在生成前必須透過 EXTEND.md 完成初始設定，包含服務提供商憑證、預設模型與品質預設值。
使用限制：請確保已正確設定對應服務商的環境變數 (例如 OPENAI_API_KEY, ARK_API_KEY, REPLICATE_API_TOKEN)。
工作流建議：利用 --promptfiles 進行自動化批次處理，並使用 --ref 為支援多模態生成的模型提供視覺上下文。
整合性：專為 AI 代理工作流設計，可將自然語言意圖 (如生成、建立、繪製) 轉換為精確的圖像生成參數。

創業課程

網上課程

實體課程

baoyu-image-gen

簡介

倉庫統計