价格与计费
LLM / 图像 / ASR / TTS / OCR 计费维度,组织实时价格查询与代表价格。
无界模型云(Wujie Model Cloud)按能力维度计费,价格参考系统价格目录,当前目录为 CNY 版本 2026-06-17。组织合同价 > 开通折扣价 > 系统价——同一个模型,组织有专属价格时按组织价计费,否则按公开开通价或系统目录计费。
私有化部署的计费维度与价格策略完全一致,仅需替换 Base 域名 → 企业私有化部署。
本页的组织实时价格查询走 master host https://ai.tos.run(/v1/pricing/lookup 不在数据面 api.tos.run 上代理)。实际单价、可用模型与折扣以控制台展示为准。
计费维度
| 能力 | 计费项 | 单位 | 规则 |
|---|---|---|---|
| LLM | prompt_tokens、cached_prompt_tokens、completion_tokens | 1M token | 非缓存输入、缓存命中输入、输出分别计费 |
| 图像 | image_1k、image_2k、image_4k | 张 | 按图片规格(含画质档位)按张计费 |
| ASR | audio_duration | 小时 | 底层按毫秒计量,价格按小时展示 |
| TTS | text_characters | 10,000 字符 | 按合成文本字符数计费 |
| OCR | ocr_pages | 页 | 按识别页数计费 |
LLM 规则
- 上下文档位按本次请求输入 token 判断:
≤128k、≤256k、>256k,不同档位单价不同。 prompt_tokens只计非缓存输入;缓存命中部分进入cached_prompt_tokens。- 缓存命中输入按更低价格计费:有显式缓存价格行时使用显式行,否则按同档输入价格的
10%(0.1×输入)计费。 - 输出按
completion_tokens计费。推理(扩展思考)、工具结果、检索上下文最终都会体现在输入或输出 token 中。
详见 Claude 对话 API 的「提示缓存」与「计费」两节。
图像规则(gpt-image-2)
gpt-image-2 按图片规格与画质档位(低 / 中 / 高)整张计费,不再单独计入图像 token:
- 1K 与 2K 同价,4K 价格翻倍。
- 不传
quality(即auto,由模型自动选择画质)时,按对应规格的「高」档(基准价)计费。
| 规格 | 低 | 中 | 高 |
|---|---|---|---|
| 1K | ¥0.10 | ¥0.16 | ¥0.20 |
| 2K | ¥0.10 | ¥0.16 | ¥0.20 |
| 4K | ¥0.20 | ¥0.32 | ¥0.40 |
接口细节见 GPT-Image 2 图像生成与编辑。
组织实时价格查询
用持有的网关 API Key 查询当前组织的有效价格目录——返回的价格已经把组织专属价格合并到系统目录之上,所见即所计费。
GET https://ai.tos.run/v1/pricing/lookup- Host:该端点在 master host
https://ai.tos.run上提供(数据面api.tos.run不代理)。 - 鉴权:HTTP 头
Authorization: Bearer <gk_...>(需有效的网关 API Key,Key 的归属组织即为查询作用域)。 - 可选查询参数:
capability(llm/image/asr/tts/ocr)、provider、model,用于按维度过滤。 - 返回结构:
{ currency, entries, version }(另含models、labels等展示辅助字段)。
curl "https://ai.tos.run/v1/pricing/lookup?capability=llm" \
-H "Authorization: Bearer $TOS_API_KEY"import os, requests
resp = requests.get(
"https://ai.tos.run/v1/pricing/lookup",
params={"capability": "llm"},
headers={"Authorization": f"Bearer {os.environ['TOS_API_KEY']}"},
)
data = resp.json()
print(data["currency"], data["version"])
for entry in data["entries"]:
print(entry)const resp = await fetch(
"https://ai.tos.run/v1/pricing/lookup?capability=llm",
{ headers: { Authorization: `Bearer ${process.env.TOS_API_KEY}` } },
);
const data = await resp.json();
console.log(data.currency, data.version);
console.log(data.entries);返回示例(结构示意,具体 entries 内容随组织有效目录而定):
{
"currency": "CNY",
"entries": [
{
"capabilityId": "llm",
"providerId": "dashscope",
"model": "qwen-plus",
"meters": { "prompt_tokens": "...", "completion_tokens": "..." }
}
],
"version": "2026-06-17"
}鉴权失败(缺少 / 无效 API Key)返回 401,作用域不足返回 403,错误体为结构化 JSON,详见 错误码与错误处理。
代表价格
以下为系统目录代表价格,实际以控制台 / 组织有效价格为准。
Claude / GPT 开通价
Claude 前沿模型按系统价 3折 展示开通价;GPT 前沿模型按系统价 0.8折 展示开通价。缓存输入按系统输入价的 0.1× 形成系统缓存价,再应用同一开通折扣。
| 模型 | 系统输入 / 1M | 系统输出 / 1M | 开通输入 / 1M | 开通缓存 / 1M | 开通输出 / 1M |
|---|---|---|---|---|---|
| claude-opus-4-8 | ¥35.5 | ¥177.5 | ¥10.65 | ¥1.065 | ¥53.25 |
| claude-sonnet-4-6 | ¥21.3 | ¥106.5 | ¥6.39 | ¥0.639 | ¥31.95 |
| claude-haiku-4-5 | ¥7.1 | ¥35.5 | ¥2.13 | ¥0.213 | ¥10.65 |
| gpt-5.5 | ¥35.5 | ¥213 | ¥2.84 | ¥0.284 | ¥17.04 |
| gpt-5.4 | ¥17.75 | ¥106.5 | ¥1.42 | ¥0.142 | ¥8.52 |
| gpt-5.4-mini | ¥5.325 | ¥31.95 | ¥0.426 | ¥0.0426 | ¥2.556 |
通用 LLM 系统价
| 模型 | 输入 / 1M | 输出 / 1M | 说明 |
|---|---|---|---|
qwen-plus ≤128k | ¥0.8 | ¥2 | 默认长文本与通用任务 |
qwen-plus 128k-256k | ¥2.4 | ¥20 | 中长上下文 |
qwen-plus >256k | ¥4.8 | ¥48 | 超长上下文 |
| qwen-turbo | ¥0.3 | ¥0.6 | 高频轻量任务 |
| qwen-max | ¥2.4 | ¥9.6 | 高质量复杂任务 |
| qwen-long | ¥0.5 | ¥2 | 长上下文任务 |
| doubao-pro-32k / 1.5-pro-32k | ¥0.8 | ¥2 | Doubao Pro 32k |
| doubao-lite-32k / 1.5-lite-32k | ¥0.3 | ¥0.6 | Doubao Lite 32k |
| doubao-pro-128k | ¥5 | ¥9 | Doubao Pro 128k |
| doubao-lite-128k | ¥0.8 | ¥1 | Doubao Lite 128k |
| 能力 | 代表项 | 价格 |
|---|---|---|
| Seedream 5.0 图像 | 1K / 2K / 4K | ¥0.42 / ¥0.78 / ¥1.56 每张 |
| Seedream 默认图像 | 1K / 2K / 4K | ¥0.2 / ¥0.4 / ¥0.8 每张 |
| gpt-image-2 图像 | 1K / 2K / 4K(高档) | ¥0.20 / ¥0.20 / ¥0.40 每张 |
| OCR | PaddleOCR / 火山 / 阿里 | ¥0.02 / ¥0.03 / ¥0.03 每页 |
| ASR | bigmodel | ¥4.5 每小时 |
| TTS | seed-tts | ¥5 每 10,000 字符 |
中文语音估算可按 250 字/min ≈ 425 token/min,语音智能体输入 token 可先按输出 token 的 3 倍 估算。
成本计算
Token 计算器
CNY 2026-06-17智能体成本计算器
默认:银行信贷价格策略由 Claude(Anthropic)模型的官方定价结构启发:按非缓存输入、缓存命中输入、输出三段计量,与 Claude 对话 API 的 usage 字段一一对应。