图像系列
图片生成
图片生成接口支持文生图、图生图、图片编辑等多种功能
POST
简介
图片生成接口支持文生图、图生图、图片编辑等多种功能。通过统一的 API 接口,您可以调用 Gemini、豆包 Seedream、GPT Image、通义千问等多个主流图像生成模型。认证
Bearer Token,如Bearer sk-xxxxxxxxxx
请求参数
模型标识,支持的模型包括:
- 通义千问系列:
qwen-image-plus、qwen-image-edit-plus等 - GPT Image 系列:
gpt-image-1等 - 豆包 Seedream 系列:
doubao-seedream-3-0-t2i-250415、doubao-seedream-4-0-250828、doubao-seedream-4-5-251128、doubao-seededit-3-0-i2i-250628等 - Gemini 系列:
gemini-2.5-flash-image(Nano Banana)、gemini-3-pro-image-preview(Nano Banana Pro) 等
文生图的提示词
响应格式:
b64_json 或 url注意:不同模型对 response_format 的支持情况不同:- 通义千问系列:支持
b64_json和url,会根据参数值返回对应格式 - GPT Image 系列:仅支持
b64_json格式,强制返回 base64 编码的图片数据 - 豆包 Seedream 系列:通常返回 URL 链接,
response_format参数可能不生效 - Gemini 系列:仅支持
b64_json格式,无论传入什么值都会返回 base64 编码的图片数据
图生图或上下文对话的多轮内容
基础示例
- Gemini
- 豆包 Seedream
- GPT Image
- 通义千问
- 文生图
- 图生图
- 多图融合
模型专用参数
豆包 Seedream
输入的图片信息。支持 URL 或 Base64 编码。doubao-seedream-4.5、doubao-seedream-4.0 支持单图或多图输入,doubao-seededit-3.0-i2i 仅支持单图输入。doubao-seedream-3-0-t2i-250415 不支持该参数。
图片尺寸,支持的尺寸取决于模型版本:
- doubao-seedream-4.0/4.5:
2048x2048、2304x1728、1728x2304、2560x1440、1440x2560等(2K/4K) - doubao-seedream-3.0:
1024x1024、1152x864、864x1152、1280x720、720x1280等
是否添加水印
随机种子,用于控制生成结果的随机性。取值范围:
0 到 2147483647引导系数,控制生成图像与提示词的匹配程度。建议范围:
1.0-10.0,默认:2.5。仅 doubao-seedream-3.0-t2i-250415 和 doubao-seededit-3.0-i2i-250628 支持组图功能开关,仅
doubao-seedream-4.0 和 doubao-seedream-4.5 支持:"disabled": 禁用组图功能(默认)"auto": 启用组图功能
提示词优化选项,仅 doubao-seedream-4.5、doubao-seedream-4.0 支持:
mode:"fast"(快速模式)或"standard"(标准模式,默认)
GPT Image
图片尺寸,支持:
1024x1024、1024x1536、1536x1024。默认:1024x1024图片质量:
"high"、"medium"、"low"生成图片数量,范围:
1-10输入保真度,仅在图生图模式下有效:
"auto"、"high"、"medium"、"low"单张输入图片,支持 URL 或 Base64 格式
多张输入图片数组,最多支持 10 张
Gemini
图片宽高比,支持:
1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9图片质量:
"standard"/"1K"(默认)、"hd"/"high"/"2K"图片尺寸,支持:
1K(默认)、2K、4K输出格式,支持:
image/png(默认)、image/jpeg响应模态,支持:
image(默认)、image-text通义千问
生成参数对象,包含以下字段:
seed: 随机种子,范围0-2147483647watermark: 是否添加水印,默认 trueprompt_extend: 是否启用提示词扩展,默认 truenegative_prompt: 负面提示词n: 输出图像数量
支持的模型
Gemini 系列
| 模型名称 | 核心能力 |
|---|---|
gemini-2.5-flash-image (Nano Banana) | 文生图、图生图、多图融合、多轮对话 |
gemini-3-pro-image-preview (Nano Banana Pro) | 更高质量输出、文生图、图生图、多图融合 |
豆包 Seedream 系列
| 模型名称 | 核心能力 |
|---|---|
doubao-seedream-3-0-t2i-250415 | 文生图、随机种子控制、引导系数调节 |
doubao-seedream-4-0-250828 | 文生图、图生图、多图融合、组图功能、2K/4K |
doubao-seedream-4-5-251128 | 文生图、图生图、多图融合、组图功能、提示词优化 |
doubao-seededit-3-0-i2i-250628 | 图片编辑、风格迁移 |
GPT Image 系列
| 模型名称 | 核心能力 |
|---|---|
gpt-image-1 | 文生图、图生图、多图融合、质量选择 |
gpt-image-1-mini | 更低成本、更快速度 |
通义千问系列
| 模型名称 | 核心能力 |
|---|---|
qwen-image-plus | 文生图、中英文文本渲染、提示词扩展 |
qwen-image-edit-plus | 图片编辑、风格迁移、物体增删 |
最佳实践
提示词优化建议
Gemini (Nano Banana)- 明确比例需求:使用”竖向构图”、“横向构图”等词汇
- 高质量关键词:“8k分辨率”、“细节丰富”、“高质量”
- 多图融合时指定融合方式(风格迁移、元素组合等)
- 动漫风格:添加”动漫风格”、“二次元”、“卡通”
- 艺术风格:添加”油画风格”、“水彩画”、“素描”
- 写实风格:添加”照片级真实”、“超写实”
- 使用
quality参数控制质量 - 使用
input_fidelity参数控制输入保真度 - 详细描述想要的画面内容
- 文本渲染:在提示词中用引号明确标注文字内容
- 简短提示词启用
prompt_extend: true - 详细提示词关闭
prompt_extend: false
常见问题
支持的图片格式有哪些?
支持的图片格式有哪些?
不同模型支持的格式不同:
- 通义千问:JPEG、JPG、PNG、BMP、TIFF、WEBP,最大 10MB
- GPT Image:JPEG、PNG、GIF、WEBP,最大 10MB
- 豆包 Seedream 4.x:JPEG、PNG、WEBP、BMP、TIFF、GIF,最大 10MB
- Gemini:PNG、JPEG、JPG、WEBP,最大 7MB
生成的图片有效期是多久?
生成的图片有效期是多久?
图片URL的有效期约为24小时。建议在收到响应后立即下载保存,或上传到您自己的存储服务。
可以同时生成多张图片吗?
可以同时生成多张图片吗?
- GPT Image:使用
n参数控制生成数量(1-10张) - 豆包 Seedream 4.x:使用组图功能生成 1-4 张
- 通义千问:每次请求生成1张,如需多张请发起多个并发请求