AI 大模型推理

  • AI 大模型推理 > 购买指南 > 融合资源包使用规则

    融合资源包使用规则

    最近更新时间: 2025-10-28 10:27:57

    概述

    融合资源包是基于模型价格比例抵扣的预付费资源包,为您提供更灵活、更经济的AI服务使用方式。通过统一的抵扣标准,让您能够在不同价位的AI模型间自由切换,享受便捷的计费体验。

    使用规则

    1. 价格比例抵扣机制

    融合资源包以 deepseek-r1 模型的输入价格(0.004元/千tokens)作为基准标准,根据您实际使用模型的各种计费项按比例进行抵扣。

    计算公式

    抵扣数量 = 模型计费项实际用量 × 资源包抵扣比例
    

    其中:

    • 资源包抵扣比例 = 目标模型计费项价格 ÷ deepseek-r1标准价格
    • deepseek-r1标准价格 = 0.004元/千tokens(输入价格基准)
    • 目标模型计费项价格 = 您实际使用模型的对应计费项价格/千tokens

    示例说明

    示例1:使用更实惠的模型计费项
    • 假设模型A的某个计费项价格为 0.002元/千tokens
    • 您的实际使用量:10,000 tokens
    • 抵扣比例计算:0.002 ÷ 0.004 = 0.5
    • 实际抵扣:10,000 × 0.5 = 5,000 tokens(等价于deepseek-r1的使用量)
    • 说明:由于模型A的该计费项价格比基准价格低50%,抵扣比例为0.5,更加经济实惠
    示例2:使用基准价格模型
    • 使用deepseek-r1模型输入(0.004元/千tokens)
    • 您的实际使用量:10,000 tokens
    • 抵扣比例计算:0.004 ÷ 0.004 = 1
    • 实际抵扣:10,000 × 1 = 10,000 tokens
    • 说明:基准价格模型按1:1比例抵扣,计费透明直观
    示例3:使用高性能模型计费项
    • 假设模型B的某个计费项价格为 0.008元/千tokens
    • 您的实际使用量:10,000 tokens
    • 抵扣比例计算:0.008 ÷ 0.004 = 2
    • 实际抵扣:10,000 × 2 = 20,000 tokens(等价于deepseek-r1的使用量)
    • 说明:由于模型B的该计费项价格比基准价格高100%,抵扣比例为2,适合高性能需求场景

    2. 后续计费方式

    当资源包余额用尽后,系统将自动切换至按量计费模式,继续按照各模型的实际计费项价格为您提供服务,确保业务连续性。

    3. 数据更新周期

    • 用量统计:分钟级更新
    • 账户余额更新:T+1 更新
    • 资源包余额更新:T+1 更新

    4. 资源包抵扣范围

    不同类型的融合资源包具有不同的模型抵扣范围和适用场景:

    抵扣范围说明

    • 通用融合包:覆盖大部分主流AI模型,适合多样化使用需求
    • 专业融合包:针对特定领域或高性能模型,抵扣范围相对集中
    • 基础融合包:主要支持基础模型和常用功能,经济实惠

    重要提醒

    ⚠️ 对于已发放到账户的资源包,具体的抵扣比例和支持的模型范围以资源包详情页面显示的信息为准

    不同规格的资源包可能有以下差异:

    • 支持的模型种类和数量
    • 具体的抵扣比例设置
    • 计费项覆盖范围(如输入、输出、特殊功能等)
    • 使用期限和额度限制

    查看方式

    对于已购买的资源包,请查看资源包详情页面的:

    • 抵扣比例列表:显示该资源包对各模型的具体抵扣比例
    • 适用范围说明:明确列出支持的模型和计费项
    • 使用限制条件:了解任何特殊的使用要求或限制

    5. 抵扣比例查询

    您可以随时查看具体的资源包抵扣比例:
    控制台 → 财务中心 → 订单管理 → 资源包管理

    image.png

    6. 使用优先级

    当您的账户同时拥有资源包和账户余额时:

    1. 优先使用资源包进行抵扣
    2. 资源包用完后,自动使用账户余额按量计费
    3. 无需手动切换,系统智能管理

    注意事项

    1. 有效期限制:资源包有效期内未使用完的余额恕不退还,请合理规划使用
    2. 资源包叠加:不同规格的资源包可以叠加使用,灵活满足各种需求
    3. 实时调整:资源包抵扣比例会根据模型的具体计费项价格实时调整
    4. 使用监控:建议定期查看资源包使用情况,合理规划使用计划,避免浪费

    常见问题

    Q: 为什么实际消耗与我的预期使用量不符?

    A: 这是使用AI工具时的常见现象,主要原因包括:

    主要原因

    1. 工具上下文开销:AI工具通常会自动携带大量上下文信息和工具参数,这些隐性内容都会计入token消耗
    2. Agent智能迭代:类似 ReAct 的智能Agent会进行多轮思考和工具调用,每次迭代都会产生token消耗
    3. 认知偏差:您可能只输入了简短的问题(十几个token),但系统内部实际调用时可能需要处理上万甚至十几万token的上下文

    典型场景

    • AI助手对话:每次交互可能包含完整的历史对话记录、工具定义说明、系统提示词等
    • 复杂任务执行:Agent执行复杂任务时,需要多轮分析、规划和工具调用才能给出最终结果
    • 代码智能生成:代码生成工具需要分析大量项目上下文和相关代码才能提供准确建议

    优化建议

    • 查看明细:在控制台的使用详情中查看具体的token消耗明细,了解实际用量分布
    • 了解机制:深入了解所使用AI工具的token计费机制和工作原理
    • 合理控制:适当控制对话历史长度和上下文范围,在功能性与成本间找到平衡

    相关文档

    如需了解更多资源包相关信息,请参考:资源包功能介绍

    以上内容是否对您有帮助?