baoyu-image-gen
基于 API 的 AI 图像生成工具,支持 OpenAI、Azure、Google、OpenRouter、DashScope、Replicate 等多个模型。提供文字生成图像、参考图引导、比例控制及批次处理功能。
简介
baoyu-image-gen 技能为专业级 AI 图像生成提供统一的界面。它作为用户提示与各类商业图像模型之间的桥梁,让创作者与工程师无需处理复杂的个别 SDK,即可调用包括 OpenAI DALL-E、Azure OpenAI、Google Imagen、OpenRouter、DashScope (通义万象)、Z.AI、MiniMax、即梦 (Jimeng)、豆包 (Seedream) 及 Replicate 等顶级 API。该工具专为快速单张影像原型设计与高吞吐量的批次生产而优化。
-
多供应商支持:通过命令行参数或项目配置文件,轻松切换不同的专门模型。
-
进阶提示处理:支持纯文本输入、读取提示文件,并可合并多个文件以达成复杂的构图需求。
-
精准参数控制:原生支持比例调整 (如 16:9, 1:1)、高质量预设值、明确尺寸指定及参考图引导生成。
-
批次处理能力:内置具备并发控制的执行逻辑,非常适合大规模制作营销素材或数据集生成。
-
配置管理:实现分层配置系统 (项目/XDG/用户),安全地管理 API 密钥与默认模型参数。
-
先决条件:执行时需安装 Bun 运行环境以获得最佳性能。
-
设置规范:系统要求在生成前必须通过 EXTEND.md 完成初始设置,包含服务提供商凭证、默认模型与质量预设值。
-
使用限制:请确保已正确设置对应服务商的环境变量 (例如 OPENAI_API_KEY, ARK_API_KEY, REPLICATE_API_TOKEN)。
-
工作流建议:利用
--promptfiles进行自动化批次处理,并使用--ref为支持多模态生成的模型提供视觉上下文。 -
整合性:专为 AI 代理工作流设计,可将自然语言意图 (如生成、创建、绘制) 转换为精确的图像生成参数。
仓库统计
- Star 数
- 16,787
- Fork 数
- 1,958
- Open Issue 数
- 1
- 主要语言
- TypeScript
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年4月29日 13:00