价格与计费说明
计费方式
AI 推理服务采用按量付费模式。
上线活动
为了庆祝产品上线,现针对所有 AI 推理的新客户,免费赠送 DeepSeek 系列共享 100 万 tokens 资源包,618 期间额外再送 200 万!! 现在就立刻体验吧!
- 领取方式:使用服务并产生计费项后自动发放,可能有 1 小时左右延迟
- 查看方式:前往我的资源包可以查看资源包的过期时间和剩余额度
- 领取条件:推理服务新用户,之前未使用过推理服务的账号
- 抵扣范围:DeepSeek R1 与 V3 两款模型
模型价格
下表所列模型价格以 千 tokens 为单位。Token 是模型用来表示自然语言文本的的最小单位,可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。
🎉 全系列实时推理模型特惠资源包,最低 6 折,快来购买吧!
实时推理
模型 ID | 输入价格( RMB/1K tokens) | 输出价格( RMB/1K tokens) |
---|---|---|
deepseek-r1 | 0.004 | 0.016 |
deepseek-v3 | 0.002 | 0.008 |
deepseek-r1-32b | 0.0015 | 0.006 |
deepseek-r1-distill-32b | 0.0015 | 0.006 |
qwen-max-2025-01-25 | 0.0024 | 0.0096 |
qwen2.5-72b-instruct | 0.004 | 0.012 |
qwen2-72b-instruct | 0.004 | 0.012 |
qwen2-vl-72b-instruct | 0.016 | 0.048 |
qwq-plus | 0.002 | 0.006 |
qwq-32b | 0.002 | 0.006 |
qwen3-235b-a22b | 0.002 | 0.008(think:0.02) |
qwen3-32b | 0.002 | 0.008(think:0.02) |
qwen3-30b-a3b | 0.00075 | 0.003(think:0.0075) |
qwen2.5-vl-7b-instruct | 0.002 | 0.005 |
qwen2.5-vl-72b-instruct | 0.016 | 0.048 |
qwen-vl-max-2025-01-25 | 0.003 | 0.009 |
doubao-1.5-pro-32k | 0.0008 | 0.002 |
doubao-1.5-vision-pro | 0.003 | 0.009 |
doubao-1.5-thinking-pro | 0.004 | 0.016 |
qwen2.5-omni-7b | 限时体验 | 限时体验 |
nvidia/llama-3.1-nemotron-ultra-253b-v1 | 限时体验 | 限时体验 |
nvidia/llama-3.3-nemotron-super-49b-v1 | 限时体验 | 限时体验 |
模型能力 | 价格(人民币)/ 单位 |
---|---|
大模型语音合成 TTS | 0.06 / 百字符 |
大模型语音识别 ASR | 0.08 / 分钟 |
大模型文字识别 OCR | 0.06 / 次 |
如果您每天的用量非常大,欢迎联系我们,获取专属定制价格。
批量推理
针对非实时任务,推荐使用异步批量推理,价格更便宜!
模型 ID | 输入价格(k/tokens) | 输出价格(k/tokens) |
---|---|---|
deepseek-r1 | 0.002 | 0.008 |
deepseek-v3 | 0.001 | 0.004 |
deepseek-r1-32b | 0.00075 | 0.003 |
扣费规则
扣减费用 = token 消耗量 × 模型单价,对应的费用将直接从充值余额或赠送余额中进行扣减。 当充值余额与赠送余额同时存在时,优先扣减赠送余额。
产品价格可能发生变动,七牛保留修改价格的权利。请您依据实际用量按需充值,定期查看此页面以获知最新价格信息。
文档反馈
(如有产品使用问题,请 提交工单)