智能多媒体 API

  • 数美垃圾文本识别服务

    最近更新时间:2018-09-27 17:37:08

    数美垃圾文本识别服务(smtextidentify),能够有效的帮助您识别文本中的垃圾广告、色情暴恐、政治违规、不文明用语等垃圾、恶意内容;提高平台用户体验,降低平台运营成本。

    注意:该功能目前仅支持华东的 bucket。

    快速使用

    第一步

    获取到您存在七牛bucket里面的文本相关信息的 url : http://ogd7tc735.bkt.clouddn.com/qiniutest.txt

    {"type":"ZHIBO","data":{"text"iphone6促销","tokenId":"tokeid_default"}}
    

    第二步

    在您的图片的url后面加上 ?smtextidentify,即 http://ogd7tc735.bkt.clouddn.com/qiniutest.txt?smtextidentify
    返回的结果:

    {
        "code":1100, //请求成功
        "message":"\u6210\u529f", //成功
        "requestId":"72bdd658c0000a4613bc282bac80626a", //请求唯一标识
            "score":263  //分数
        "riskLevel":"PASS", //文本为正常文本
            "detail":{
                    "riskType":0,
                    "model":"",
                    "description":"",
                    "isBlackToken":"",
                    "matchedList":"",
                    "matchedItem":"",
                    "matchedField":"",
                    "filteredText":""
            }    
    }
    

    如何开启

    进入七牛开发者平台第三方数据处理,找到 数美垃圾文本识别服务 点击并开始使用。

    请求语法

    GET <DownloadURI>?smtextidentify HTTP/1.1
    Host: <DownloadHost>
    
    <DownLoadURI>所指向的文件的格式
    {"type":"ZHIBO","data":{"text"iphone6促销","tokenId":"tokeid_default"}}
    type可选值 "ZHIBO","ECOM"。
    text为检测的文本内容。
    tokenId为提供文本的用户。
    

    请求头部

    头部名称 必填 说明
    Host 下载服务器域名,可为七牛三级域名或自定义二级域名,参考七牛自定义域名绑定流程

    响应语法

    HTTP/1.1 200 OK
    Content-Type: application/json
    Cache-Control: no-store
    
    {
        // ...smtextidentify data...
    }
    

    响应头部

    头部名称 必填 说明
    Content-Type MIME类型,固定为application/json
    Cache-Control 缓存控制,固定为no-store,不缓存。

    响应内容

    如果请求成功,返回包含如下内容的JSON字符串(已格式化,便于阅读):

    {
        "code": "<ResultCode         int>",
        "message": "<ResultMessage   string>",
        "requestId": "<RequestId     string>",
            "score": "<Score             float64>",
        "riskLevel": "<RiskLevel     string>", 
        "detail": "<DetailInfo       string>"
    }
    
    字段名称 必填 说明
    code 处理状态:1100请求成功'1101'代理服务出错1902参数错误1903服务失败9100余额不足9101无权限操作
    message code对应的状态描述信息
    requestId 请求唯一标识,可用于后续数据查询
    score 风险分数(code 为 1100 时存在) 取值范围[0,1000],分数越高风险越大
    riskLevel 级别(code 为 1100 时存在)分为3级,PASS、REVIEW、REJECT,PASS表示正常文本,REVIEW表示需要人工审核,REJECT表示为垃圾文本
    detail 详细描述信息(code 为 1100 时存在)

    detail 字段说明

    字段名称 必填 说明
    riskType 标识风险类型,可能取值: 0:正常 100:涉政 200:色情 210:辱骂 300:广告 400:灌水 500:无意义 700:黑名单 710:白名单 800:高危账号 900:自定义
    model 规则标识,用来标识文本命中的策略规则。 注:该参数为旧版 API 返回参数,兼容保留, 后续版本将去除,请勿依赖此参数,仅供参考
    decription 策略规则风险原因描述 注:该参数为旧版 API 返回参数,兼容保留, 后续版本将去除,请勿依赖此参数,仅供参考
    isBlackToken 该账号被画像策略标记为高危账号
    matchedList 命中敏感词所在的名单名称(该参数仅在命中敏感词时存在)
    matchedItem 命中的具体敏感词(该参数仅在命中敏感词时存在)
    matchedField 标识昵称或文本内容命中了敏感词(该参数仅在命中敏感词时存在),可选值: text:文本命中敏感词;nickname:昵称命中敏感词
    filteredText 命中的敏感词被替换为*后的文本(该参数仅在命中敏感词时存在)

    示例

    在Web浏览器中输入以下图片地址:

    http://ogd7tc735.bkt.clouddn.com/qiniutest.txt?smtextidentify
    

    返回结果(内容经过格式化以便阅读):

    {
        "code":1100,   
        "message":"\u6210\u529f",
        "requestId":"72bdd658c0000a4613bc282bac80626a",
            "score":263
        "riskLevel":"PASS",
            "detail":{
                    "riskType":0,
                    "model":"",
                    "description":"",
                    "isBlackToken":"",
                    "matchedList":"",
                    "matchedItem":"",
                    "matchedField":"",
                    "filteredText":""
            }    
    }
    

    服务价格

    调用量(次/天) 单价(元/千次)
    0 - 50万 3.0
    50万 - 200万 2.0
    > 200万 1.6

    说明: 根据单日检测数据量阶梯收费,检测量以调用次数为单位。注:单日检测量按照月度总检测量除以天数计算平均值得到。
    计费示例:
    示例1: 某公司调用垃圾文本识别服务,日均发起50万次请求,则费用为:50万x3.0元/千次=1500元
    示例2: 某公司调用垃圾文本识别服务,日均发起100万次请求,则费用为: 50万x3.0元/千次+50万x2.0元/千次=2500元

    以上内容是否对您有帮助?
  • Icon free helper
    Close