智能多媒体 API

  • 达观数据垃圾评论过滤服务

    最近更新时间:2017-01-23 12:35:55

    文本垃圾评论过滤服务(dg_spam_filter_v1)能够帮您有效判断保存在七牛云的文本是否属于广告以及文本质量如何。

    本服务由达而观信息科技(上海)有限公司(以下简称达观数据)提供。启用服务后,您存储在七牛云空间的文件将在您主动请求的情况下被提供给达观数据以供其计算使用。七牛不能保证鉴别结果的正确性,请您自行评估后选择是否启用。服务价格请您参考具体的服务价格,您使用本服务产生的费用由七牛代收。启用服务则表示您知晓并同意以上内容。

    注意

    • 资源的 Mime 文件格式仅支持文本类型:text/*,如:text/plain、text/html 等。
    • 资源(文本)的编码格式支持:UTF-8、GBK、GB2312、GB18030、Big5(繁体中文)等常用编码类型。
    • 该功能目前仅支持华东的 bucket。

    如何开启

    进入七牛开发者平台第三方数据处理,找到 垃圾评论过滤 点击并开始使用。

    请求语法

        GET <TextDownloadURI>?dg_spam_filter_v1/<Params> HTTP/1.1
        Host: <TextDownloadHost>
    
    参数 必填 说明
    Params 未设置时,同时显示广告评论和文本质量指数;
    ad:只显示广告评论指数;
    nonsense:只显示文本质量指数

    #示例

    资源为http://7xr1ta.com1.z0.glb.clouddn.com/test_spam_filter.txt,处理样式为 dg_spam_filter_v1。

        **构造请求URL**
        RequestUrl = 'http://7xr1ta.com1.z0.glb.clouddn.com/test_spam_filter.txt?dg_spam_filter_v1'
    

    请求头部

    头部名称 必填 说明
    Host 下载服务器域名,必须为七牛三级域名或自定义二级域名,参考七牛自定义域名的绑定流程。

    响应语法

    HTTP/1.1 200 OK
    Content-Type: application/json
    Cache-Control: no-store
    {
       // ...text data...
    }
    

    响应头部

    头部名称 必填 说明
    Content-Type MIME 类型,固定为 application/json
    Content-Control 缓存控制,固定为 no-store,不缓存

    响应内容

    • 如果请求成功,返回包含如下内容的 JSON 字符串(已格式化,便于阅读):
    {
      "request_id": 1472721238356779,
      # 请求处理状态
      "status": "OK",
      # 是否是广告评论
      "is_ad": 0,
      # 广告评论指数
      "weight_ad": 0.05,
      # 是否是低质量文本
      "is_nonsense": 0,
      # 文本质量指数
      "weight_nonsense": 0.381835,
      
    }
    
    • 如果请求失败,请参考 statuscode 字段的说明。
    • status 执行结果,OK为成功,FAIL为失败,WARN为有部分非重要字段异常,请根据返回错误信息进行排查
    • is_ad 0为正常文本,1为广告评论
    • weight_ad 广告评论权重, 0到1之间。数值越大,该评论为广告评论的概率越大
    • is_nonsense 0为正常文本,1为无意义文本
    • weight_nonsense 无意义文本权重, 0到1之间。数值越大,该评论为无意义文本的概率

    示例

    • 同时显示广告和文本质量指数 http://7xr1ta.com1.z0.glb.clouddn.com/test_spam_filter.txt?dg_spam_filter_v1
    • 指定只显示广告评论指数 http://7xr1ta.com1.z0.glb.clouddn.com/test_spam_filter.txt?dg_spam_filter_v1/ad
    • 指定只显示文本质量指数 http://7xr1ta.com1.z0.glb.clouddn.com/test_spam_filter.txt?dg_spam_filter_v1/nonsense
    以上内容是否对您有帮助?
  • Icon free helper
    Close