Nano Banana 图像生成与编辑

无界模型云 Nano Banana（Gemini 香蕉生图）系列文生图、图生图 API，OpenAI 兼容，按张计费。

Nano Banana（香蕉生图）是 Gemini 图像系列在无界模型云上的接入，包含 Nano Banana 2（小香蕉，快） 与 Nano Banana Pro（大香蕉，质量优先） 两款模型。它们复用你已经在用的同一套 OpenAI 兼容图像接口：纯文本生成图像（文生图）与参考图编辑（图生图）。网关在内部把标准的 OpenAI Images 请求 / 响应自动适配到底层 Gemini 契约——调用方无需关心底层协议，照常使用标准图像 API，并拿到标准的 { data: [{ b64_json }] } 响应。已有 OpenAI 图像客户端只需切换 Base、Key 和 model 即可接入。

概览

文生图：POST https://api.tos.run/v1/images/generations，application/json。
图生图 / 改图：POST https://api.tos.run/v1/images/edits，multipart/form-data。
两款模型（model 字段）：
- Nano Banana 2（小香蕉）：gemini-3.1-flash-image——速度优先，适合快速预览、批量草稿。
- Nano Banana Pro（大香蕉）：gemini-3.0-pro-image——质量优先，适合复杂构图、商业海报。
尺寸用 OpenAI 标准 size（1K / 2K / 4K 档位）配合网关扩展字段 aspectRatio（如 "16:9"）；Gemini 只支持离散的比例 + 清晰度档位，实际输出分辨率由后端按「比例 + 档位」决定。
按张计费，各尺寸（1K / 2K / 4K）同价；单价见价格与计费。

接口与 OpenAI Images API 兼容。网关只透传它真正支持的参数，其余 OpenAI 参数会被忽略——见下方「OpenAI 兼容性」。

鉴权与 Base

API 数据面 Base：https://api.tos.run/v1（浏览器控制台是 https://ai.tos.run，不要用作 API Base）
鉴权头：Authorization: Bearer $AI_TOS_API_KEY

鉴权与 Base 与 gpt-image-2 完全一致。API Key 在控制台创建，调用时通过 Authorization 头传入。生产环境请把 Key 放在服务端，不要暴露到浏览器。

模型选择

两款模型共用同一套接口，只是 model 字段不同。按场景选型：

	Nano Banana 2（小香蕉）	Nano Banana Pro（大香蕉）
`model`	`gemini-3.1-flash-image`	`gemini-3.0-pro-image`
定位	速度优先	质量优先
典型场景	快速预览、批量草稿、日常轻量生图	复杂构图、商业海报、需要更稳定细节
计费	按张，各尺寸同价	按张，各尺寸同价
延迟	较低	较高

对速度敏感、批量出图用小香蕉；要质量、要复杂版式的商业产出用大香蕉。两款都按张计费，与尺寸（1K/2K/4K）无关。

文生图

向 /v1/images/generations 发送 JSON 请求，传入 model、prompt，以及可选的 size、aspectRatio。

curl "https://api.tos.run/v1/images/generations" \
  -H "Authorization: Bearer $AI_TOS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.1-flash-image",
    "prompt": "夕阳下的海边咖啡馆露台，暖色调，木质桌椅与绿植，电影感横版构图",
    "size": "2K",
    "aspectRatio": "16:9"
  }'

返回标准 OpenAI 形态，图片在 data[0].b64_json（纯 base64）：

{ "created": 1717488000, "data": [{ "b64_json": "/9j/4AAQSkZJRg..." }], "usage": { "generated_images": 1 } }

除了 OpenAI 标准的 size，文生图还支持网关扩展字段 aspectRatio（如 "16:9"、"3:4"），配合 1K / 2K / 4K 档位决定最终分辨率。大香蕉换成 "model": "gemini-3.0-pro-image" 即可，其它字段不变。

图生图与改图

向 /v1/images/edits 发送 multipart/form-data 请求：用 image 字段上传参考图，prompt 描述要做的修改。网关会把参考图作为内联图像传给模型。

curl "https://api.tos.run/v1/images/edits" \
  -H "Authorization: Bearer $AI_TOS_API_KEY" \
  -F "model=gemini-3.1-flash-image" \
  -F "image=@banana.png" \
  -F "prompt=在香蕉顶上加一顶小小的草编派对帽，其余保持不变" \
  -F "size=1K" \
  -F "aspectRatio=1:1"

支持上传多张参考图做融合（重复 image[] 字段，最多 6 张，单张 ≤ 20MB，png/jpeg/webp），在提示词里用「图1 / 图2」按上传顺序引用。改图不需要 mask；需要 mask 局部重绘请用 gpt-image-2。

尺寸与比例

Gemini 系列只支持离散的比例 + 清晰度档位，没有任意像素尺寸：

aspectRatio 支持 1:1、2:3、3:2、3:4、4:3、4:5、5:4、9:16、16:9、21:9，默认 1:1。
size 用档位（1K / 2K / 4K）表达清晰度，配合 aspectRatio 决定最终的 宽x高。
实际输出像素由后端按「比例 + 档位」决定，不等于 size 的字面正方形（例如 2:3 + 2K ≈ 1696×2528）。

计费只看模型，不看尺寸——1K / 2K / 4K 同价。4K 生成更慢、更易遇到上游繁忙，建议先用 1K 调提示词、正式交付用 2K。

输出

输出以 b64_json（纯 base64，通常是 JPEG/PNG）返回，客户端按字节解码写入文件即可，无需关心具体编码。
单次调用返回单张图，在 data[0].b64_json。

Google 原生接口（/v1beta generateContent）

除 OpenAI 兼容的 /v1/images/*，本系列还支持 Google Generative Language（Gemini）原生协议，方便 google-genai SDK / Gemini 兼容工具直接把 Base URL 指向网关：

文生图 / 改图：POST https://api.tos.run/v1beta/models/{model}:generateContent
模型列表：GET https://api.tos.run/v1beta/models

curl "https://api.tos.run/v1beta/models/gemini-3.1-flash-image:generateContent" \
  -H "Authorization: Bearer $AI_TOS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{ "parts": [{ "text": "夕阳下的海边咖啡馆露台，电影感横版构图" }] }],
    "generationConfig": { "responseModalities": ["IMAGE"], "imageConfig": { "aspectRatio": "16:9", "imageSize": "2K" } }
  }'

图片在 candidates[0].content.parts[].inlineData.data（纯 base64）。改图把参考图作为 { "inlineData": { "mimeType": "image/png", "data": "<base64>" } } 放进 parts。鉴权、路由、计费与 OpenAI 接口完全一致——网关内部统一处理，无需关心底层。

两套接口（OpenAI /v1/images/* 与 Google /v1beta/models/*:generateContent）等价，任选其一。已有 OpenAI 客户端用前者；用 google-genai SDK 的项目用后者，只需把 Base 指向 https://api.tos.run。

与 gpt-image-2 的区别 / 选型建议

	Nano Banana（Gemini）	gpt-image-2
接口形态	完全一致（同一套 `/v1/images/*`）	同左
`model`	`gemini-3.1-flash-image` / `gemini-3.0-pro-image`	`gpt-image-2`
尺寸控制	离散比例 + 档位	自定义 `宽x高`（16 的倍数）+ 自动对齐
计费	按张，与尺寸无关	按尺寸 × 质量档
局部重绘 mask	不支持	支持

选型建议：

要快、要批量草稿 → 小香蕉 gemini-3.1-flash-image。
要质量、复杂构图、商业海报 → 大香蕉 gemini-3.0-pro-image。
需要精确像素尺寸或 mask 局部重绘 → 优先 gpt-image-2。

OpenAI 兼容性

本接口与 OpenAI Images API 兼容。网关只透传它真正支持的参数（model / prompt / size / 扩展字段 aspectRatio，以及 edits 的 image / image[]），其余 OpenAI 参数会被静默忽略。调用方始终收到一次性的完整 JSON 响应，没有面向调用方的流式。已有 OpenAI 图像客户端只需切换 Base、Key 和 model，照常发请求即可接入。

价格

两款模型均按张计费，各尺寸（1K / 2K / 4K）同价。具体单价、计费方式与组织专属价格，请以「价格与计费」页与控制台展示为准。

Nano Banana 图像生成与编辑

目录