TensorFusion Docs

价格与计费

LLM / 图像 / ASR / TTS / OCR 计费维度,组织实时价格查询与代表价格。

无界模型云(Wujie Model Cloud)按能力维度计费,价格参考系统价格目录,当前目录为 CNY 版本 2026-06-17组织合同价 > 开通折扣价 > 系统价——同一个模型,组织有专属价格时按组织价计费,否则按公开开通价或系统目录计费。

私有化部署的计费维度与价格策略完全一致,仅需替换 Base 域名 → 企业私有化部署

本页的组织实时价格查询走 master host https://ai.tos.run/v1/pricing/lookup 不在数据面 api.tos.run 上代理)。实际单价、可用模型与折扣以控制台展示为准。

计费维度

能力计费项单位规则
LLMprompt_tokenscached_prompt_tokenscompletion_tokens1M token非缓存输入、缓存命中输入、输出分别计费
图像image_1kimage_2kimage_4k按图片规格(含画质档位)按张计费
ASRaudio_duration小时底层按毫秒计量,价格按小时展示
TTStext_characters10,000 字符按合成文本字符数计费
OCRocr_pages按识别页数计费

LLM 规则

  • 上下文档位按本次请求输入 token 判断:≤128k≤256k>256k,不同档位单价不同。
  • prompt_tokens 只计非缓存输入;缓存命中部分进入 cached_prompt_tokens
  • 缓存命中输入按更低价格计费:有显式缓存价格行时使用显式行,否则按同档输入价格的 10%0.1× 输入)计费。
  • 输出按 completion_tokens 计费。推理(扩展思考)、工具结果、检索上下文最终都会体现在输入或输出 token 中。

详见 Claude 对话 API 的「提示缓存」与「计费」两节。

图像规则(gpt-image-2)

gpt-image-2 按图片规格与画质档位(低 / 中 / 高)整张计费,不再单独计入图像 token:

  • 1K 与 2K 同价,4K 价格翻倍。
  • 不传 quality(即 auto,由模型自动选择画质)时,按对应规格的「高」档(基准价)计费。
规格
1K¥0.10¥0.16¥0.20
2K¥0.10¥0.16¥0.20
4K¥0.20¥0.32¥0.40

接口细节见 GPT-Image 2 图像生成与编辑

组织实时价格查询

用持有的网关 API Key 查询当前组织的有效价格目录——返回的价格已经把组织专属价格合并到系统目录之上,所见即所计费。

GET https://ai.tos.run/v1/pricing/lookup
  • Host:该端点在 master host https://ai.tos.run 上提供(数据面 api.tos.run 不代理)。
  • 鉴权:HTTP 头 Authorization: Bearer <gk_...>(需有效的网关 API Key,Key 的归属组织即为查询作用域)。
  • 可选查询参数capabilityllm / image / asr / tts / ocr)、providermodel,用于按维度过滤。
  • 返回结构{ currency, entries, version }(另含 modelslabels 等展示辅助字段)。
curl "https://ai.tos.run/v1/pricing/lookup?capability=llm" \
  -H "Authorization: Bearer $TOS_API_KEY"
import os, requests

resp = requests.get(
    "https://ai.tos.run/v1/pricing/lookup",
    params={"capability": "llm"},
    headers={"Authorization": f"Bearer {os.environ['TOS_API_KEY']}"},
)
data = resp.json()
print(data["currency"], data["version"])
for entry in data["entries"]:
    print(entry)
const resp = await fetch(
  "https://ai.tos.run/v1/pricing/lookup?capability=llm",
  { headers: { Authorization: `Bearer ${process.env.TOS_API_KEY}` } },
);
const data = await resp.json();
console.log(data.currency, data.version);
console.log(data.entries);

返回示例(结构示意,具体 entries 内容随组织有效目录而定):

{
  "currency": "CNY",
  "entries": [
    {
      "capabilityId": "llm",
      "providerId": "dashscope",
      "model": "qwen-plus",
      "meters": { "prompt_tokens": "...", "completion_tokens": "..." }
    }
  ],
  "version": "2026-06-17"
}

鉴权失败(缺少 / 无效 API Key)返回 401,作用域不足返回 403,错误体为结构化 JSON,详见 错误码与错误处理

代表价格

以下为系统目录代表价格,实际以控制台 / 组织有效价格为准

Claude / GPT 开通价

Claude 前沿模型按系统价 3折 展示开通价;GPT 前沿模型按系统价 0.8折 展示开通价。缓存输入按系统输入价的 0.1× 形成系统缓存价,再应用同一开通折扣。

模型系统输入 / 1M系统输出 / 1M开通输入 / 1M开通缓存 / 1M开通输出 / 1M
claude-opus-4-8¥35.5¥177.5¥10.65¥1.065¥53.25
claude-sonnet-4-6¥21.3¥106.5¥6.39¥0.639¥31.95
claude-haiku-4-5¥7.1¥35.5¥2.13¥0.213¥10.65
gpt-5.5¥35.5¥213¥2.84¥0.284¥17.04
gpt-5.4¥17.75¥106.5¥1.42¥0.142¥8.52
gpt-5.4-mini¥5.325¥31.95¥0.426¥0.0426¥2.556

通用 LLM 系统价

模型输入 / 1M输出 / 1M说明
qwen-plus ≤128k¥0.8¥2默认长文本与通用任务
qwen-plus 128k-256k¥2.4¥20中长上下文
qwen-plus >256k¥4.8¥48超长上下文
qwen-turbo¥0.3¥0.6高频轻量任务
qwen-max¥2.4¥9.6高质量复杂任务
qwen-long¥0.5¥2长上下文任务
doubao-pro-32k / 1.5-pro-32k¥0.8¥2Doubao Pro 32k
doubao-lite-32k / 1.5-lite-32k¥0.3¥0.6Doubao Lite 32k
doubao-pro-128k¥5¥9Doubao Pro 128k
doubao-lite-128k¥0.8¥1Doubao Lite 128k
能力代表项价格
Seedream 5.0 图像1K / 2K / 4K¥0.42 / ¥0.78 / ¥1.56 每张
Seedream 默认图像1K / 2K / 4K¥0.2 / ¥0.4 / ¥0.8 每张
gpt-image-2 图像1K / 2K / 4K(高档)¥0.20 / ¥0.20 / ¥0.40 每张
OCRPaddleOCR / 火山 / 阿里¥0.02 / ¥0.03 / ¥0.03 每页
ASRbigmodel¥4.5 每小时
TTSseed-tts¥5 每 10,000 字符

中文语音估算可按 250 字/min ≈ 425 token/min,语音智能体输入 token 可先按输出 token 的 3 倍 估算。

成本计算

Token 计算器

CNY 2026-06-17
输入价
¥0.8000 / 1M
缓存价
¥0.2000 / 1M
输出价
¥2 / 1M
有效输入
4,000 token
本次成本
¥0.0092
语音 token 参考
估算输出
4,250 token
估算输入
12,750 token

智能体成本计算器

默认:银行信贷
模型档位占比合计 100%
周期请求
8,640 次
单次有效输入
6,250 token
单次有效输出
5,625 token
周期 token
54,000,000 / 48,600,000
周期成本
¥140.4

价格策略由 Claude(Anthropic)模型的官方定价结构启发:按非缓存输入、缓存命中输入、输出三段计量,与 Claude 对话 APIusage 字段一一对应。

目录