AI 大模型推理

  • AI 大模型推理 > 购买指南 > 价格与计费说明

    价格与计费说明

    最近更新时间: 2025-06-13 18:19:23

    计费方式

    AI 推理服务采用按量付费模式。

    上线活动

    为了庆祝产品上线,现针对所有 AI 推理的新客户,免费赠送 DeepSeek 系列共享 100 万 tokens 资源包,618 期间额外再送 200 万!! 现在就立刻体验吧!

    • 领取方式:使用服务并产生计费项后自动发放,可能有 1 小时左右延迟
    • 查看方式:前往我的资源包可以查看资源包的过期时间和剩余额度
    • 领取条件:推理服务新用户,之前未使用过推理服务的账号
    • 抵扣范围:DeepSeek R1 与 V3 两款模型

    模型价格

    下表所列模型价格以 千 tokens 为单位。Token 是模型用来表示自然语言文本的的最小单位,可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。

    🎉 全系列实时推理模型特惠资源包,最低 6 折,快来购买吧!

    实时推理

    模型 ID 输入价格( RMB/1K tokens) 输出价格( RMB/1K tokens)
    deepseek-r1 0.004 0.016
    deepseek-v3 0.002 0.008
    deepseek-r1-32b 0.0015 0.006
    deepseek-r1-distill-32b 0.0015 0.006
    qwen-max-2025-01-25 0.0024 0.0096
    qwen2.5-72b-instruct 0.004 0.012
    qwen2-72b-instruct 0.004 0.012
    qwen2-vl-72b-instruct 0.016 0.048
    qwq-plus 0.002 0.006
    qwq-32b 0.002 0.006
    qwen3-235b-a22b 0.002 0.008(think:0.02)
    qwen3-32b 0.002 0.008(think:0.02)
    qwen3-30b-a3b 0.00075 0.003(think:0.0075)
    qwen2.5-vl-7b-instruct 0.002 0.005
    qwen2.5-vl-72b-instruct 0.016 0.048
    qwen-vl-max-2025-01-25 0.003 0.009
    doubao-1.5-pro-32k 0.0008 0.002
    doubao-1.5-vision-pro 0.003 0.009
    doubao-1.5-thinking-pro 0.004 0.016
    qwen2.5-omni-7b 限时体验 限时体验
    nvidia/llama-3.1-nemotron-ultra-253b-v1 限时体验 限时体验
    nvidia/llama-3.3-nemotron-super-49b-v1 限时体验 限时体验
    模型能力 价格(人民币)/ 单位
    大模型语音合成 TTS 0.06 / 百字符
    大模型语音识别 ASR 0.08 / 分钟
    大模型文字识别 OCR 0.06 / 次

    如果您每天的用量非常大,欢迎联系我们,获取专属定制价格。

    批量推理

    针对非实时任务,推荐使用异步批量推理,价格更便宜!

    模型 ID 输入价格(k/tokens) 输出价格(k/tokens)
    deepseek-r1 0.002 0.008
    deepseek-v3 0.001 0.004
    deepseek-r1-32b 0.00075 0.003

    扣费规则

    扣减费用 = token 消耗量 × 模型单价,对应的费用将直接从充值余额或赠送余额中进行扣减。 当充值余额与赠送余额同时存在时,优先扣减赠送余额。

    产品价格可能发生变动,七牛保留修改价格的权利。请您依据实际用量按需充值,定期查看此页面以获知最新价格信息。

    以上内容是否对您有帮助?
  • Close