简介

baoyu-image-gen 技能为专业级 AI 图像生成提供统一的界面。它作为用户提示与各类商业图像模型之间的桥梁，让创作者与工程师无需处理复杂的个别 SDK，即可调用包括 OpenAI DALL-E、Azure OpenAI、Google Imagen、OpenRouter、DashScope (通义万象)、Z.AI、MiniMax、即梦 (Jimeng)、豆包 (Seedream) 及 Replicate 等顶级 API。该工具专为快速单张影像原型设计与高吞吐量的批次生产而优化。

多供应商支持：通过命令行参数或项目配置文件，轻松切换不同的专门模型。
进阶提示处理：支持纯文本输入、读取提示文件，并可合并多个文件以达成复杂的构图需求。
精准参数控制：原生支持比例调整 (如 16:9, 1:1)、高质量预设值、明确尺寸指定及参考图引导生成。
批次处理能力：内置具备并发控制的执行逻辑，非常适合大规模制作营销素材或数据集生成。
配置管理：实现分层配置系统 (项目/XDG/用户)，安全地管理 API 密钥与默认模型参数。
先决条件：执行时需安装 Bun 运行环境以获得最佳性能。
设置规范：系统要求在生成前必须通过 EXTEND.md 完成初始设置，包含服务提供商凭证、默认模型与质量预设值。
使用限制：请确保已正确设置对应服务商的环境变量 (例如 OPENAI_API_KEY, ARK_API_KEY, REPLICATE_API_TOKEN)。
工作流建议：利用 --promptfiles 进行自动化批次处理，并使用 --ref 为支持多模态生成的模型提供视觉上下文。
整合性：专为 AI 代理工作流设计，可将自然语言意图 (如生成、创建、绘制) 转换为精确的图像生成参数。

创业课程

在线课程

实体课程

baoyu-image-gen

简介

仓库统计