Nano Banana 图像生成与编辑
无界模型云 Nano Banana(Gemini 香蕉生图)系列文生图、图生图 API,OpenAI 兼容,按张计费。
Nano Banana(香蕉生图)是 Gemini 图像系列在无界模型云上的接入,包含 Nano Banana 2(小香蕉,快) 与 Nano Banana Pro(大香蕉,质量优先) 两款模型。它们复用你已经在用的同一套 OpenAI 兼容图像接口:纯文本生成图像(文生图)与参考图编辑(图生图)。网关在内部把标准的 OpenAI Images 请求 / 响应自动适配到底层 Gemini 契约——调用方无需关心底层协议,照常使用标准图像 API,并拿到标准的 { data: [{ b64_json }] } 响应。已有 OpenAI 图像客户端只需切换 Base、Key 和 model 即可接入。
概览
- 文生图:
POST https://api.tos.run/v1/images/generations,application/json。 - 图生图 / 改图:
POST https://api.tos.run/v1/images/edits,multipart/form-data。 - 两款模型(
model字段):- Nano Banana 2(小香蕉):
gemini-3.1-flash-image——速度优先,适合快速预览、批量草稿。 - Nano Banana Pro(大香蕉):
gemini-3.0-pro-image——质量优先,适合复杂构图、商业海报。
- Nano Banana 2(小香蕉):
- 尺寸用 OpenAI 标准
size(1K/2K/4K档位)配合网关扩展字段aspectRatio(如"16:9");Gemini 只支持离散的比例 + 清晰度档位,实际输出分辨率由后端按「比例 + 档位」决定。 - 按张计费,各尺寸(1K / 2K / 4K)同价;单价见价格与计费。
接口与 OpenAI Images API 兼容。网关只透传它真正支持的参数,其余 OpenAI 参数会被忽略——见下方「OpenAI 兼容性」。
鉴权与 Base
- API 数据面 Base:
https://api.tos.run/v1(浏览器控制台是https://ai.tos.run,不要用作 API Base) - 鉴权头:
Authorization: Bearer $AI_TOS_API_KEY
鉴权与 Base 与 gpt-image-2 完全一致。API Key 在控制台创建,调用时通过 Authorization 头传入。生产环境请把 Key 放在服务端,不要暴露到浏览器。
模型选择
两款模型共用同一套接口,只是 model 字段不同。按场景选型:
| Nano Banana 2(小香蕉) | Nano Banana Pro(大香蕉) | |
|---|---|---|
model | gemini-3.1-flash-image | gemini-3.0-pro-image |
| 定位 | 速度优先 | 质量优先 |
| 典型场景 | 快速预览、批量草稿、日常轻量生图 | 复杂构图、商业海报、需要更稳定细节 |
| 计费 | 按张,各尺寸同价 | 按张,各尺寸同价 |
| 延迟 | 较低 | 较高 |
对速度敏感、批量出图用小香蕉;要质量、要复杂版式的商业产出用大香蕉。两款都按张计费,与尺寸(1K/2K/4K)无关。
文生图
向 /v1/images/generations 发送 JSON 请求,传入 model、prompt,以及可选的 size、aspectRatio。
curl "https://api.tos.run/v1/images/generations" \
-H "Authorization: Bearer $AI_TOS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.1-flash-image",
"prompt": "夕阳下的海边咖啡馆露台,暖色调,木质桌椅与绿植,电影感横版构图",
"size": "2K",
"aspectRatio": "16:9"
}'返回标准 OpenAI 形态,图片在 data[0].b64_json(纯 base64):
{ "created": 1717488000, "data": [{ "b64_json": "/9j/4AAQSkZJRg..." }], "usage": { "generated_images": 1 } }除了 OpenAI 标准的 size,文生图还支持网关扩展字段 aspectRatio(如 "16:9"、"3:4"),配合 1K / 2K / 4K 档位决定最终分辨率。大香蕉换成 "model": "gemini-3.0-pro-image" 即可,其它字段不变。
图生图与改图
向 /v1/images/edits 发送 multipart/form-data 请求:用 image 字段上传参考图,prompt 描述要做的修改。网关会把参考图作为内联图像传给模型。
curl "https://api.tos.run/v1/images/edits" \
-H "Authorization: Bearer $AI_TOS_API_KEY" \
-F "model=gemini-3.1-flash-image" \
-F "image=@banana.png" \
-F "prompt=在香蕉顶上加一顶小小的草编派对帽,其余保持不变" \
-F "size=1K" \
-F "aspectRatio=1:1"支持上传多张参考图做融合(重复 image[] 字段,最多 6 张,单张 ≤ 20MB,png/jpeg/webp),在提示词里用「图1 / 图2」按上传顺序引用。改图不需要 mask;需要 mask 局部重绘请用 gpt-image-2。
尺寸与比例
Gemini 系列只支持离散的比例 + 清晰度档位,没有任意像素尺寸:
aspectRatio支持1:1、2:3、3:2、3:4、4:3、4:5、5:4、9:16、16:9、21:9,默认1:1。size用档位(1K/2K/4K)表达清晰度,配合aspectRatio决定最终的宽x高。- 实际输出像素由后端按「比例 + 档位」决定,不等于
size的字面正方形(例如2:3+2K≈ 1696×2528)。
计费只看模型,不看尺寸——1K / 2K / 4K 同价。4K 生成更慢、更易遇到上游繁忙,建议先用 1K 调提示词、正式交付用 2K。
输出
- 输出以
b64_json(纯 base64,通常是 JPEG/PNG)返回,客户端按字节解码写入文件即可,无需关心具体编码。 - 单次调用返回单张图,在
data[0].b64_json。
Google 原生接口(/v1beta generateContent)
除 OpenAI 兼容的 /v1/images/*,本系列还支持 Google Generative Language(Gemini)原生协议,方便 google-genai SDK / Gemini 兼容工具直接把 Base URL 指向网关:
- 文生图 / 改图:
POST https://api.tos.run/v1beta/models/{model}:generateContent - 模型列表:
GET https://api.tos.run/v1beta/models
curl "https://api.tos.run/v1beta/models/gemini-3.1-flash-image:generateContent" \
-H "Authorization: Bearer $AI_TOS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{ "parts": [{ "text": "夕阳下的海边咖啡馆露台,电影感横版构图" }] }],
"generationConfig": { "responseModalities": ["IMAGE"], "imageConfig": { "aspectRatio": "16:9", "imageSize": "2K" } }
}'图片在 candidates[0].content.parts[].inlineData.data(纯 base64)。改图把参考图作为
{ "inlineData": { "mimeType": "image/png", "data": "<base64>" } } 放进 parts。
鉴权、路由、计费与 OpenAI 接口完全一致——网关内部统一处理,无需关心底层。
两套接口(OpenAI /v1/images/* 与 Google /v1beta/models/*:generateContent)等价,任选其一。已有 OpenAI 客户端用前者;用 google-genai SDK 的项目用后者,只需把 Base 指向 https://api.tos.run。
与 gpt-image-2 的区别 / 选型建议
| Nano Banana(Gemini) | gpt-image-2 | |
|---|---|---|
| 接口形态 | 完全一致(同一套 /v1/images/*) | 同左 |
model | gemini-3.1-flash-image / gemini-3.0-pro-image | gpt-image-2 |
| 尺寸控制 | 离散比例 + 档位 | 自定义 宽x高(16 的倍数)+ 自动对齐 |
| 计费 | 按张,与尺寸无关 | 按尺寸 × 质量档 |
| 局部重绘 mask | 不支持 | 支持 |
选型建议:
- 要快、要批量草稿 → 小香蕉
gemini-3.1-flash-image。 - 要质量、复杂构图、商业海报 → 大香蕉
gemini-3.0-pro-image。 - 需要精确像素尺寸或 mask 局部重绘 → 优先 gpt-image-2。
OpenAI 兼容性
本接口与 OpenAI Images API 兼容。网关只透传它真正支持的参数(model / prompt / size / 扩展字段 aspectRatio,以及 edits 的 image / image[]),其余 OpenAI 参数会被静默忽略。调用方始终收到一次性的完整 JSON 响应,没有面向调用方的流式。已有 OpenAI 图像客户端只需切换 Base、Key 和 model,照常发请求即可接入。
价格
两款模型均按张计费,各尺寸(1K / 2K / 4K)同价。具体单价、计费方式与组织专属价格,请以「价格与计费」页与控制台展示为准。