价格与计费 | 同思智算

LLM / 图像 / ASR / TTS / OCR 计费维度，组织实时价格查询与代表价格。

无界模型云（Wujie Model Cloud）按能力维度计费，价格参考系统价格目录，当前目录为 CNY 版本 2026-06-17。组织合同价＞开通折扣价＞系统价——同一个模型，组织有专属价格时按组织价计费，否则按公开开通价或系统目录计费。

私有化部署的计费维度与价格策略完全一致，仅需替换 Base 域名 → 企业私有化部署。

本页的组织实时价格查询走 master host https://ai.tos.run（/v1/pricing/lookup 不在数据面 api.tos.run 上代理）。实际单价、可用模型与折扣以控制台展示为准。

计费维度

能力	计费项	单位	规则
LLM	`prompt_tokens`、`cached_prompt_tokens`、`completion_tokens`	1M token	非缓存输入、缓存命中输入、输出分别计费
图像	`image_1k`、`image_2k`、`image_4k`	张	按图片规格（含画质档位）按张计费
ASR	`audio_duration`	小时	底层按毫秒计量，价格按小时展示
TTS	`text_characters`	10,000 字符	按合成文本字符数计费
OCR	`ocr_pages`	页	按识别页数计费

LLM 规则

上下文档位按本次请求输入 token 判断：≤128k、≤256k、>256k，不同档位单价不同。
prompt_tokens 只计非缓存输入；缓存命中部分进入 cached_prompt_tokens。
缓存命中输入按更低价格计费：有显式缓存价格行时使用显式行，否则按同档输入价格的 10%（0.1× 输入）计费。
输出按 completion_tokens 计费。推理（扩展思考）、工具结果、检索上下文最终都会体现在输入或输出 token 中。

详见 Claude 对话 API 的「提示缓存」与「计费」两节。

图像规则（gpt-image-2）

gpt-image-2 按图片规格与画质档位（低 / 中 / 高）整张计费，不再单独计入图像 token：

1K 与 2K 同价，4K 价格翻倍。
不传 quality（即 auto，由模型自动选择画质）时，按对应规格的「高」档（基准价）计费。

规格	低	中	高
1K	¥0.10	¥0.16	¥0.20
2K	¥0.10	¥0.16	¥0.20
4K	¥0.20	¥0.32	¥0.40

接口细节见 GPT-Image 2 图像生成与编辑。

组织实时价格查询

用持有的网关 API Key 查询当前组织的有效价格目录——返回的价格已经把组织专属价格合并到系统目录之上，所见即所计费。

GET https://ai.tos.run/v1/pricing/lookup

Host：该端点在 master host https://ai.tos.run 上提供（数据面 api.tos.run 不代理）。
鉴权：HTTP 头 Authorization: Bearer <gk_...>（需有效的网关 API Key，Key 的归属组织即为查询作用域）。
可选查询参数：capability（llm / image / asr / tts / ocr）、provider、model，用于按维度过滤。
返回结构：{ currency, entries, version }（另含 models、labels 等展示辅助字段）。

curl "https://ai.tos.run/v1/pricing/lookup?capability=llm" \
  -H "Authorization: Bearer $TOS_API_KEY"

import os, requests

resp = requests.get(
    "https://ai.tos.run/v1/pricing/lookup",
    params={"capability": "llm"},
    headers={"Authorization": f"Bearer {os.environ['TOS_API_KEY']}"},
)
data = resp.json()
print(data["currency"], data["version"])
for entry in data["entries"]:
    print(entry)

const resp = await fetch(
  "https://ai.tos.run/v1/pricing/lookup?capability=llm",
  { headers: { Authorization: `Bearer ${process.env.TOS_API_KEY}` } },
);
const data = await resp.json();
console.log(data.currency, data.version);
console.log(data.entries);

返回示例（结构示意，具体 entries 内容随组织有效目录而定）：

{
  "currency": "CNY",
  "entries": [
    {
      "capabilityId": "llm",
      "providerId": "dashscope",
      "model": "qwen-plus",
      "meters": { "prompt_tokens": "...", "completion_tokens": "..." }
    }
  ],
  "version": "2026-06-17"
}

鉴权失败（缺少 / 无效 API Key）返回 401，作用域不足返回 403，错误体为结构化 JSON，详见错误码与错误处理。

代表价格

以下为系统目录代表价格，实际以控制台 / 组织有效价格为准。

Claude / GPT 开通价

Claude 前沿模型按系统价 3折 展示开通价；GPT 前沿模型按系统价 0.8折 展示开通价。缓存输入按系统输入价的 0.1× 形成系统缓存价，再应用同一开通折扣。

模型	系统输入 / 1M	系统输出 / 1M	开通输入 / 1M	开通缓存 / 1M	开通输出 / 1M
claude-opus-4-8	¥35.5	¥177.5	¥10.65	¥1.065	¥53.25
claude-sonnet-4-6	¥21.3	¥106.5	¥6.39	¥0.639	¥31.95
claude-haiku-4-5	¥7.1	¥35.5	¥2.13	¥0.213	¥10.65
gpt-5.5	¥35.5	¥213	¥2.84	¥0.284	¥17.04
gpt-5.4	¥17.75	¥106.5	¥1.42	¥0.142	¥8.52
gpt-5.4-mini	¥5.325	¥31.95	¥0.426	¥0.0426	¥2.556

通用 LLM 系统价

模型	输入 / 1M	输出 / 1M	说明
qwen-plus `≤128k`	¥0.8	¥2	默认长文本与通用任务
qwen-plus `128k-256k`	¥2.4	¥20	中长上下文
qwen-plus `>256k`	¥4.8	¥48	超长上下文
qwen-turbo	¥0.3	¥0.6	高频轻量任务
qwen-max	¥2.4	¥9.6	高质量复杂任务
qwen-long	¥0.5	¥2	长上下文任务
doubao-pro-32k / 1.5-pro-32k	¥0.8	¥2	Doubao Pro 32k
doubao-lite-32k / 1.5-lite-32k	¥0.3	¥0.6	Doubao Lite 32k
doubao-pro-128k	¥5	¥9	Doubao Pro 128k
doubao-lite-128k	¥0.8	¥1	Doubao Lite 128k

能力	代表项	价格
Seedream 5.0 图像	1K / 2K / 4K	¥0.42 / ¥0.78 / ¥1.56 每张
Seedream 默认图像	1K / 2K / 4K	¥0.2 / ¥0.4 / ¥0.8 每张
gpt-image-2 图像	1K / 2K / 4K（高档）	¥0.20 / ¥0.20 / ¥0.40 每张
OCR	PaddleOCR / 火山 / 阿里	¥0.02 / ¥0.03 / ¥0.03 每页
ASR	bigmodel	¥4.5 每小时
TTS	seed-tts	¥5 每 10,000 字符

中文语音估算可按 250 字/min ≈ 425 token/min，语音智能体输入 token 可先按输出 token 的 3 倍 估算。

成本计算

Token 计算器

CNY 2026-06-17

模型

上下文档位

输入 token

缓存输入 token

输出 token

输入价

¥0.8000 / 1M

缓存价

¥0.2000 / 1M

输出价

¥2 / 1M

有效输入

4,000 token

本次成本

¥0.0092

语音 token 参考

中文语音时长

min

估算输出

4,250 token

估算输入

12,750 token

智能体成本计算器

默认：银行信贷

模型

周期

每小时请求

难度系数

单次输入 token

单次输出 token

思考倍率

工具调用概率

工具额外输入

工具额外输出

模型档位占比合计 100%

≤128k · ¥0.8/2

128k-256k · ¥2.4/20

>256k · ¥4.8/48

周期请求

8,640 次

单次有效输入

6,250 token

单次有效输出

5,625 token

周期 token

54,000,000 / 48,600,000

周期成本

¥140.4

价格策略由 Claude（Anthropic）模型的官方定价结构启发：按非缓存输入、缓存命中输入、输出三段计量，与 Claude 对话 API 的 usage 字段一一对应。