TensorFusion Docs

Nano Banana 图像生成与编辑

无界模型云 Nano Banana(Gemini 香蕉生图)系列文生图、图生图 API,OpenAI 兼容,按张计费。

Nano Banana(香蕉生图)是 Gemini 图像系列在无界模型云上的接入,包含 Nano Banana 2(小香蕉,快)Nano Banana Pro(大香蕉,质量优先) 两款模型。它们复用你已经在用的同一套 OpenAI 兼容图像接口:纯文本生成图像(文生图)与参考图编辑(图生图)。网关在内部把标准的 OpenAI Images 请求 / 响应自动适配到底层 Gemini 契约——调用方无需关心底层协议,照常使用标准图像 API,并拿到标准的 { data: [{ b64_json }] } 响应。已有 OpenAI 图像客户端只需切换 Base、Key 和 model 即可接入。

概览

  • 文生图POST https://api.tos.run/v1/images/generationsapplication/json
  • 图生图 / 改图POST https://api.tos.run/v1/images/editsmultipart/form-data
  • 两款模型model 字段):
    • Nano Banana 2(小香蕉)gemini-3.1-flash-image——速度优先,适合快速预览、批量草稿。
    • Nano Banana Pro(大香蕉)gemini-3.0-pro-image——质量优先,适合复杂构图、商业海报。
  • 尺寸用 OpenAI 标准 size1K / 2K / 4K 档位)配合网关扩展字段 aspectRatio(如 "16:9");Gemini 只支持离散的比例 + 清晰度档位,实际输出分辨率由后端按「比例 + 档位」决定。
  • 按张计费,各尺寸(1K / 2K / 4K)同价;单价见价格与计费

接口与 OpenAI Images API 兼容。网关只透传它真正支持的参数,其余 OpenAI 参数会被忽略——见下方「OpenAI 兼容性」。

鉴权与 Base

  • API 数据面 Base:https://api.tos.run/v1(浏览器控制台是 https://ai.tos.run不要用作 API Base)
  • 鉴权头:Authorization: Bearer $AI_TOS_API_KEY

鉴权与 Base 与 gpt-image-2 完全一致。API Key 在控制台创建,调用时通过 Authorization 头传入。生产环境请把 Key 放在服务端,不要暴露到浏览器。

模型选择

两款模型共用同一套接口,只是 model 字段不同。按场景选型:

Nano Banana 2(小香蕉)Nano Banana Pro(大香蕉)
modelgemini-3.1-flash-imagegemini-3.0-pro-image
定位速度优先质量优先
典型场景快速预览、批量草稿、日常轻量生图复杂构图、商业海报、需要更稳定细节
计费按张,各尺寸同价按张,各尺寸同价
延迟较低较高

对速度敏感、批量出图用小香蕉;要质量、要复杂版式的商业产出用大香蕉。两款都按计费,与尺寸(1K/2K/4K)无关。

文生图

/v1/images/generations 发送 JSON 请求,传入 modelprompt,以及可选的 sizeaspectRatio

curl "https://api.tos.run/v1/images/generations" \
  -H "Authorization: Bearer $AI_TOS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.1-flash-image",
    "prompt": "夕阳下的海边咖啡馆露台,暖色调,木质桌椅与绿植,电影感横版构图",
    "size": "2K",
    "aspectRatio": "16:9"
  }'

返回标准 OpenAI 形态,图片在 data[0].b64_json(纯 base64):

{ "created": 1717488000, "data": [{ "b64_json": "/9j/4AAQSkZJRg..." }], "usage": { "generated_images": 1 } }

除了 OpenAI 标准的 size,文生图还支持网关扩展字段 aspectRatio(如 "16:9""3:4"),配合 1K / 2K / 4K 档位决定最终分辨率。大香蕉换成 "model": "gemini-3.0-pro-image" 即可,其它字段不变。

图生图与改图

/v1/images/edits 发送 multipart/form-data 请求:用 image 字段上传参考图,prompt 描述要做的修改。网关会把参考图作为内联图像传给模型。

curl "https://api.tos.run/v1/images/edits" \
  -H "Authorization: Bearer $AI_TOS_API_KEY" \
  -F "model=gemini-3.1-flash-image" \
  -F "image=@banana.png" \
  -F "prompt=在香蕉顶上加一顶小小的草编派对帽,其余保持不变" \
  -F "size=1K" \
  -F "aspectRatio=1:1"

支持上传多张参考图做融合(重复 image[] 字段,最多 6 张,单张 ≤ 20MB,png/jpeg/webp),在提示词里用「图1 / 图2」按上传顺序引用。改图不需要 mask;需要 mask 局部重绘请用 gpt-image-2

尺寸与比例

Gemini 系列只支持离散的比例 + 清晰度档位,没有任意像素尺寸:

  • aspectRatio 支持 1:12:33:23:44:34:55:49:1616:921:9,默认 1:1
  • size 用档位(1K / 2K / 4K)表达清晰度,配合 aspectRatio 决定最终的 宽x高
  • 实际输出像素由后端按「比例 + 档位」决定,不等于 size 的字面正方形(例如 2:3 + 2K ≈ 1696×2528)。

计费只看模型,不看尺寸——1K / 2K / 4K 同价。4K 生成更慢、更易遇到上游繁忙,建议先用 1K 调提示词、正式交付用 2K

输出

  • 输出以 b64_json(纯 base64,通常是 JPEG/PNG)返回,客户端按字节解码写入文件即可,无需关心具体编码。
  • 单次调用返回单张图,在 data[0].b64_json

Google 原生接口(/v1beta generateContent)

除 OpenAI 兼容的 /v1/images/*,本系列还支持 Google Generative Language(Gemini)原生协议,方便 google-genai SDK / Gemini 兼容工具直接把 Base URL 指向网关:

  • 文生图 / 改图:POST https://api.tos.run/v1beta/models/{model}:generateContent
  • 模型列表:GET https://api.tos.run/v1beta/models
curl "https://api.tos.run/v1beta/models/gemini-3.1-flash-image:generateContent" \
  -H "Authorization: Bearer $AI_TOS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{ "parts": [{ "text": "夕阳下的海边咖啡馆露台,电影感横版构图" }] }],
    "generationConfig": { "responseModalities": ["IMAGE"], "imageConfig": { "aspectRatio": "16:9", "imageSize": "2K" } }
  }'

图片在 candidates[0].content.parts[].inlineData.data(纯 base64)。改图把参考图作为 { "inlineData": { "mimeType": "image/png", "data": "<base64>" } } 放进 parts。 鉴权、路由、计费与 OpenAI 接口完全一致——网关内部统一处理,无需关心底层。

两套接口(OpenAI /v1/images/* 与 Google /v1beta/models/*:generateContent)等价,任选其一。已有 OpenAI 客户端用前者;用 google-genai SDK 的项目用后者,只需把 Base 指向 https://api.tos.run

与 gpt-image-2 的区别 / 选型建议

Nano Banana(Gemini)gpt-image-2
接口形态完全一致(同一套 /v1/images/*同左
modelgemini-3.1-flash-image / gemini-3.0-pro-imagegpt-image-2
尺寸控制离散比例 + 档位自定义 宽x高(16 的倍数)+ 自动对齐
计费按张,与尺寸无关按尺寸 × 质量档
局部重绘 mask不支持支持

选型建议:

  • 要快、要批量草稿 → 小香蕉 gemini-3.1-flash-image
  • 要质量、复杂构图、商业海报 → 大香蕉 gemini-3.0-pro-image
  • 需要精确像素尺寸或 mask 局部重绘 → 优先 gpt-image-2

OpenAI 兼容性

本接口与 OpenAI Images API 兼容。网关只透传它真正支持的参数(model / prompt / size / 扩展字段 aspectRatio,以及 edits 的 image / image[]),其余 OpenAI 参数会被静默忽略。调用方始终收到一次性的完整 JSON 响应,没有面向调用方的流式。已有 OpenAI 图像客户端只需切换 Base、Key 和 model,照常发请求即可接入。

价格

两款模型均按张计费,各尺寸(1K / 2K / 4K)同价。具体单价、计费方式与组织专属价格,请以「价格与计费」页与控制台展示为准。

目录