图普科技广告过滤服务增强版
广告过滤服务增强版能够帮您有效判断保存在七牛云的带文字图片是否属于广告,如果图片被识别为带有文字,会将对应的文字内容识别出来反馈给您,您可以方便的根据文本信息去判断是否是广告内容。
本服务由广州图普网络科技有限公司(以下简称图普科技)提供。启用服务后,您存储在七牛云空间的文件将在您主动请求的情况下被提供给图普科技以供其计算使用。七牛不能保证鉴别结果的正确性,请您自行评估后选择是否启用。服务价格请您参考具体的价格表及计费示例,您使用本服务产生的费用由七牛代收。启用服务则表示您知晓并同意以上内容。
注意:该功能目前仅支持华东的 bucket。
开启服务
如果您的文件存储在七牛云,则需先开启本服务。点此进入七牛开发者平台,点击右上角开始使用按钮。
如果您的文件存储在其他地方,则直接调用本接口。
请求语法
GET <ImageDownloadURI>?ad-plus HTTP/1.1
Host: <ImageDownloadHost>
**注意:**当您下载私有空间的资源时,ImageDownloadURI 的生成方法请参考七牛的下载凭证。
**示例:**资源为http://78re52.com1.z0.glb.clouddn.com/resource/gogopher.jpg,处理样式为 ad-plus。
#构造下载URL
DownloadUrl = 'http://78re52.com1.z0.glb.clouddn.com/resource/gogopher.jpg?ad-plus'
……
#最后得到
RealDownloadUrl = 'http://78re52.com1.z0.glb.clouddn.com/resource/gogopher.jpg?ad-plus&e=×××&token=MY_ACCESS_KEY:×××'
请求头部
头部名称 | 必填 | 说明 |
---|---|---|
Host | 是 | 下载服务器域名,必须是七牛三级域名或自定义二级域名,参考七牛自定义域名绑定流程 |
响应语法
HTTP/1.1 200 OK
Content-Type: application/json
Cache-Control: no-store
{
// ...ad data...
}
响应头部
头部名称 | 必填 | 说明 |
---|---|---|
Content-Type | 是 | MIME 类型,固定为 application/json |
Cache-Control | 是 | 缓存控制,固定为 no-store,不缓存 |
响应内容
- 如果请求成功,返回包含如下内容的 JSON 字符串 (已格式化,便于阅读):
{
"code": "<ResultCode int>",
"message": "<ResultMessage string>",
"fileList": [
{
"rate": <Rate float>,
"label": <Category int>,
"name": "<FileName string>",
"review": <Review boolean>,
"objects": <Object object>
}
],
"statistic": [
<Statistics int>,
...
],
"reviewCount": <ReviewCount int>,
"nonce": "<Nonce string>",
"timestamp": "<Timestamp string>"
}
字段名称 | 必填 | 说明 |
---|---|---|
code | 是 | 处理状态,0: 调用成功,1: 授权失败,2: 模型 ID 错误,3: 没有上传文件,4: API 版本号错误,5: API 版本已弃用,6: secretId 错误,7: 任务 Id 错误,您的 secretId 不能调用该任务,8: secretId 状态异常,9: 尚未上传证书,100: 服务器错误,101: 未知错误 |
message | 是 | 与 code 对应的状态描述信息 |
rate | 是 | 介于 0-1 间的浮点数,表示该图像被识别为某个分类的概率值,概率越高、机器越肯定;您可以根据您的需求确定需要人工复审的界限 |
label | 是 | 表示该图像被机器判定为哪个分类,0: 正常,非广告,1: 包含二维码,但需要客户自己分析该图片中的二维码是否为广告,2: 带文字图片,图片上的文字会通过 objects 的 text 返回给客户,客户可以利用关键字过滤来判定是否为广告。**注意:**label = -1,说明该图片格式不被支持,或者图片有损坏等异常 |
review | 是 | 是否需要人工复审该图片,true: 需要,false: 不需要。**注意:**review 是对 label 判定的可信度说明,不是对 objects 检测到的文本准确度说明 |
objects | 是 | 如果是图片被识别为带文字 (label=2),其他情况 objects 为空数组。objects 是图片上的文本信息,如:objects: [{ text: ‘淘宝客服’,location:[ [ 0.01171875, 0.140625 ],[ 0.4609375, 0.140625 ],[ 0.4609375, 0.26171875 ],[ 0.01171875, 0.26171875 ] ] }],其中,text: 识别到的一句文本,location: 该文本在图片上的位置信息 |
- 如果请求失败,请参考 code 和 message 字段的说明。
服务示例
在 Web 浏览器中输入以下图片地址:
http://78re52.com1.z0.glb.clouddn.com/resource/gogopher.jpg?ad-plus
返回结果 (已格式化,便于阅读):
{
"fileList":[
{
"label": 0,
"rate": 0.9875897169113159,
"review": false,
"name": "gogopher.jpg",
"objects": [ ]
}
],
"nonce":"0.2003860322292894",
"timestamp":1470985185,
"code":0,
"message":"success"
}
服务价格
确定部分 | 不确定部分 | |
---|---|---|
范围(张) | 单价(元/百张) | 单价(元/百张) |
0 - 300万 | 0.25 | 0.0625 |
300万 - 1500万 | 0.23 | 0.0575 |
1500万 - 3000万 | 0.21 | 0.0525 |
> 3000万 | 0.18 | 0.045 |
说明:
- 确定部分:准确度超过人工,无需 review(返回数据中 review 为 false)。
- 不确定部分:需要人工 review,但根据返回的参考值排序可以大大降低工作量(返回数据中 review 为 true)。
**注意:**review 是对 label 判定的可信度说明,不是对 objects 检测到的文本准确度说明。
计费示例
某公司 2015 年 5 月使用七牛广告过滤服务,共发起 500 万次广告过滤请求,其中结果确定的次数为 480 万次,结果不确定的次数为 20 万次,则当月使用七牛广告过滤服务产生的费用为:
确定的结果产生费用:0.25 元/百次 * 300 万次 + 0.23 元/百次 * (480 万次 - 300 万次) = 7500 元 + 4140 元 = 11640 元
不确定的结果产生费用:0.0625 元/百次 * 20 万次 = 125 元
总计费用:11640 元 + 125 元 = 11765 元