智能多媒体服务

  • 智能多媒体 > API 文档 > Open API >数美音频文件审核

    数美音频文件审核

    最近更新时间:2021-02-02 10:17:23

    功能描述

    音频文件审核功能为音频文件的内容审核场景提供涉政,国歌,色情,广告,娇喘,音色标签,唱歌等内容的识别,并且可以依据具体的业务场景进行配置,帮助您提前防御内容风险,提高审核效率,净化网络环境,提升用户体验。

    接口规格

    提交音频识别请求

    请求URL: https://censor-open.qiniuapi.com/anti_fraud/v2/audio

    字符编码格式: 请求及返回结果都使用 UTF-8 字符集进行编码

    请求方法: POST

    建议超时时长: 3s

    请求参数

    放在 HTTP Body 中,采用 Json 格式,具体参数如下:

    参数名称 类型 是否必选 说明
    type string Y 需要识别的违规类型,可选值:
    POLITICAL:涉政识别
    ANTHEN:国歌识别
    PORN:色情识别
    AD:广告识别
    MOAN:娇喘识别
    GENDER:性别识别
    TIMBRE:音色标签(需要同时传入GENDER才能生效)
    SING:唱歌识别
    如需做组合识别,通过下划线连接即可,例如AD_PORN_POLITICAL用于广告、色情和涉政识别。
    DEFAULT: 默认取值
    POLITICAL_PORN_MOAN
    data json_object Y 请求数据,最长1MB,详细内容参见下表
    callback string N 异步检测结果回调通知您的URL,支持HTTP和HTTPS。字段为空时,您必须通过查询接口主动查询结果。
    callbackParam json_object N 透传字段,当callback存在时可选,发送回调请求时服务将该字段内容同音频结果一起返回

    其中,data的内容如下:

    参数名称 类型 是否必选 说明
    url string Y 待识别音频url地址
    audioName string N 音频文件名称
    tokenId string N 用户账号标识
    channel string N 业务场景名称,见channel字段说明
    returnAllText bool N 取值为true时,返回所有音频片段识别结果(每10秒一个音频片段);取值为false 时,返回风险片段(riskLevel为REJECT或REVIEW)识别结果。默认为false。
    nickname string N 用户昵称
    timestamp int N 时间戳(毫秒级)
    room string N 房间号

    channel字段说明

    根据客户不同业务场景,配置不同的渠道(channel),制定针对性的拦截策略,同时也方便客户针对不同业务场景的数据进行筛选、分析。业务场景和渠道取值对应表如下:

    业务场景 channel 取值 备注
    群聊语音 GROUP_CHAT 群聊中的语音消息
    私聊语音 MESSAGE 私聊中的语音消息
    录播语音 AUDIO_PROFILE 语音录播文件

    返回参数

    放在 HTTP Body 中,采用 Json 格式,具体参数如下:

    参数名称 类型 是否必选 说明
    code int Y 返回码
    message string Y 返回码详情描述
    entryid string Y 请求唯一标识

    异步回调识别结果

    用户如果需要服务端主动对音频检测结果进行回调,则需要在请求参数中传入callback参数,服务端审核完成后将识别结果主动回调到该地址。

    支持协议: HTTP或HTTPS

    字符编码格式: 请求及返回结果都使用UTF-8字符集进行编码

    请求方法: POST

    建议超时时长: 5s

    返回字段:
    放在 HTTP Body 中,采用 Json 格式,具体参数如下:

    参数名称 类型 是否必选 说明
    code int Y 返回码
    message string Y 返回码详情描述
    entryid string Y 请求唯一标识
    audioText string Y 音频转译文本结果
    audioTime int N 整段音频的音频时长,单位秒,code为1100时存在
    labels string N 音频片段风险原因汇总
    riskLevel string N 识别结果,可能返回值:
    PASS:正常内容
    REVIEW:疑似违规内容
    REJECT:违规内容
    detail json_array N 风险详情
    gender json_object N 性别标签与概率值
    isSing int N 表示该条音频文件是否唱歌,0表示没有唱歌,1表示唱歌。
    仅当type传入值包含SING时返回。
    language json_array N 语种标签与概率值列表
    tags json_array N 音色标签与概率值列表
    callbackParam json_object Y 客户传入的透传字段

    detail 数组中每一项的具体参数如下:

    参数名称 类型 是否必选 说明
    audioStarttime int Y 风险音频片段在音频中的起始时间,单位秒
    audioEndtime int Y 风险音频片段在音频中的结束时间,单位秒
    audioUrl string Y 风险音频片段地址
    audioText string Y 音频片段对应的文本内容
    riskLevel string Y 识别结果,可能返回值:
    REJECT:违规内容
    REVIEW:疑似违规内容
    riskType int N 风险类型,可能取值:
    0:正常
    100:涉政
    120:国歌
    200:色情
    210:辱骂
    250:娇喘
    300:广告
    700:黑名单
    900:自定义
    audioMatchedItem string N 音频中可能出现的敏感词
    description string Y 风险原因描述

    gender 参数结构如下:

    参数名称 类型 是否必选 说明
    label string Y 性别标签名称,可能取值:
    男性
    女性
    confidence int Y 对应性别可能性大小,取值0-100,数值越高表示概率越大。

    language 数组中每一项具体参数如下:

    参数名称 类型 是否必选 说明
    label int Y 语种识别类别标识,可能取值:
    0:普通话
    1:英语
    2:粤语
    confidence int Y 对应语种标签可能性大小,取值0-100,数值越高表示概率越大。

    tags 数组中每一项具体参数如下:

    参数名称 类型 是否必选 说明
    label string Y 音色标签类别,可能取值:
    大叔音
    青年音
    正太音
    老年音
    女王音
    御姐音
    少女音
    萝莉音
    大妈音
    confidence int Y 对应音色标签可能性大小,取值0-100,数值越高表示概率越大。

    查询识别结果

    请求URL: https://censor-open.qiniuapi.com/anti_fraud/v2/query_audio

    字符编码格式: 请求及返回结果都使用UTF-8字符集进行编码

    请求方法: POST

    建议超时时长: 5s

    请求参数:

    放在 HTTP Body 中,采用 Json 格式,具体参数如下:

    参数名称 类型 是否必选 说明
    entryid string Y 音频唯一标识,用于查询识别结果

    返回参数:

    放在 HTTP Body 中,采用 Json 格式,具体参数如下:

    参数名称 类型 是否必选 说明
    code int Y 返回码
    message string Y 返回码详情描述
    entryid string Y 请求唯一标识
    audioText string Y 音频转译文本结果
    audioTime int N 整段音频的音频时长,单位秒,code为1100时存在
    labels string N 音频片段风险原因汇总
    riskLevel string N 识别结果,可能返回值:
    PASS:正常内容
    REVIEW:疑似违规内容
    REJECT:违规内容
    detail json_array N 风险详情
    gender json_object N 性别标签与概率值
    isSing int N 表示该条音频文件是否唱歌,0表示没有唱歌,1表示唱歌。
    仅当type传入值包含SING时返回。
    language json_array N 语种标签与概率值列表
    tags json_array N 音色标签与概率值列表
    callbackParam json_object Y 客户传入的透传字段

    detail 数组中每一项的具体参数如下:

    参数名称 类型 是否必选 说明
    audioStarttime int Y 风险音频片段在音频中的起始时间,单位秒
    audioEndtime int Y 风险音频片段在音频中的结束时间,单位秒
    audioUrl string Y 风险音频片段地址
    audioText string Y 音频片段对应的文本内容
    riskLevel string Y 识别结果,可能返回值:
    REJECT:违规内容
    REVIEW:疑似违规内容
    riskType int N 风险类型,可能取值:
    0:正常
    100:涉政
    120:国歌
    200:色情
    210:辱骂
    250:娇喘
    300:广告
    700:黑名单
    900:自定义
    audioMatchedItem string N 音频中可能出现的敏感词
    description string Y 风险原因描述

    gender 参数结构如下:

    参数名称 类型 是否必选 说明
    label string Y 性别标签名称,可能取值:
    男性
    女性
    confidence int Y 对应性别可能性大小,取值0-100,数值越高表示概率越大。

    language 数组中每一项具体参数如下:

    参数名称 类型 是否必选 说明
    label int Y 语种识别类别标识,可能取值:
    0:普通话
    1:英语
    2:粤语
    confidence int Y 对应语种标签可能性大小,取值0-100,数值越高表示概率越大。

    tags 数组中每一项具体参数如下:

    参数名称 类型 是否必选 说明
    label string Y 音色标签类别,可能取值:
    大叔音
    青年音
    正太音
    老年音
    女王音
    御姐音
    少女音
    萝莉音
    大妈音
    confidence int Y 对应音色标签可能性大小,取值0-100,数值越高表示概率越大。

    示例

    请求示例

    POST /anti_fraud/v2/audio HTTP/1.1
    Host: censor-open.qiniuapi.com
    Content-Type: application/json
    Authorization: Qiniu YnxrxOSvGotRZpqkZnMzl_euuoqRzOKUd6zwbRju:r6a-o2UpBg6A4puIMnkCExH8lE8=
    
    {
        "type":"DEFAULT",
        "data":{
            "tokenId":"test_01",
            "url":"http://xxxxxxxx.mp3",
            "channel":"IM_MESSAGE",
            "returnAllText":true
        },
        "callback":"http://xxxxxxxxx",
        "callbackParam":{
            "param1":1,
            "param2":"qew", 
            "param3":true
        }
    }
    

    返回示例

    HTTP/1.1 200 OK
    Content-Type: application/json
    
    {
        "code":1100,
        "message":"成功", 
        "entryrid":"5564f430ee6a1adb40f06d768b40316b",
    }
    

    回调示例

    POST /xxxx HTTP/1.1
    Host: xxxx
    Content-Type: application/json
    
    {
        "code":1100,
        "message":"成功", 
        "entryid":"b891cf2d82e214de45df33fc2bea4875",
        "riskLevel":"REJECT",
        "audioText":"法轮大法好",
        "labels":"涉政-音频",
        "detail":[{
            "audioStarttime":10,
            "audioEndtime":20,
            "audioUrl":"http://xxxxxxxx.wav",
            "audioText":"法轮大法好",
            "riskLevel":"REJECT",
            "audioMatchedItem":"法轮",
            "riskType":100,
            "description":"涉政-音频"
        }],
        "tags":[
            {
                "label":"男性",
                "confidence":90
            },
            {
                "label":"大叔音",
                "confidence”:91
            },
            {
                "label":"正太音",
                "confidence":21
            },
            {
                "label":"老年音",
                "confidence":11
            },
            {
                "label":"青年音",
                "confidence":31
            }
        ],
        "callbackParam":{
            "param1":1,
            "param2":"qew", 
            "param3":true
        }
    }
    

    错误码

    Code Message
    1100 成功
    1901 QPS受限
    1902 参数不合法
    1903 服务失败
    1911 下载超时
    91xx 内部错误
    以上内容是否对您有帮助?
  • Qvm free helper
    Close