锐智转码
支持锐智转码,可根据视频场景内容自适应进行转码,在不损失画质的情况下(肉眼无感知)以总体更低的码率进行转码,可通过七牛公众号->解密七牛云锐智转码技术,了解更多内容。
本文为您介绍锐智转码的简介,如何通过上传自动触发方式、控制台、API发起转码,并为您详细介绍锐智转码预设的参数。
简介
锐智高清的智能自适应目标是在不同场景下匹配最优的算法,追求最佳的收益效果。
- 以在线教育场景为例,屏幕录制为视频主要内容,针对屏幕内容采用特定算法可取得有效的针对性提升;
- 秀场场景,算法会更倾向于人脸和细节上的优化;
- 体育场景,运动目标检测和去运动模糊是主要关注点。
智能场景分类
智能场景分类,可以适配更佳的算法提升压缩和画质效果。针对视频场景和复杂度进行两层分类,场景上包含:秀场、游戏、动漫、教育、体育、户外、影视、会议、交通等10多个类型;在部分场景上,会进一步做复杂度的分级。通过深度学习大量训练,目前CNN网络模型的准确度达到95%以上。
场景分类为自适应算法策略奠定基础,对于不同场景,适配的算法类别包括:
- 编码压缩算法和工具的组合
- 前处理算法类别和参数
- ROI感兴趣区域的算法
- 客观质量评价工具VMAF的较准
- Per-Title参数的选取
锐智转码功能特性
- 视频处理:完善的转码与转封装]能力,进行丰富的媒体格式转换。
- 音频处理:音频转码、音频抽取、音频替换、音频混音等。
- 水印:支持图片水印、文字水印,并且支持多水印添加。
- 多清晰度预设:标清、全高清、2k、4k等多个预置清晰度,提供最佳经验值,降低接入门槛。
- 片段截取:是指裁剪视频的某一段,输出成一个新视频。常用于截取视频中精彩或关键的内容。
- 视频马赛克:在视频中添加马赛克,满足遮标需求。
使用场景
-
降低存储、分发成本: 保证在相同画质质量的前提下,调整视频码率、提高视频压缩率、减小文件体积,从而减少播放卡顿并节省存储和流量费用。
-
多终端设备适配:适配PC、TV以及移动终端等多平台播放。
-
多种网络环境适配:多种网络环境适配:不同网络带宽的用户选择最佳码率,流畅播放
-
水印添加:在视频上添加企业Logo、电视台台标、用户ID或昵称等标志性信息,用于品牌宣传或者宣示当前视频的版权归属。
不转码的情况
- 如果用户已经自己在本地进行过转码操作,不需要进行二次处理,也可以选择不转码。
- 在短视频等场景下,视频通常已在端上进行过拍摄和压缩,已经具备多终端播放的能力。此时可以不进行转码。
发起转码的方式
-
通过上传自动触发方式转码
-
通知指定文件发起转码
-
通过API发起转码
- 通过调用 API 手动发起转码处理任务请求。该操作常用于工作流无法满足用户场景时,需用户自己判断业务逻辑,使用API提交转码任务。例如:并不是所有的视频都需要转码,不同视频需要设置不同的转码配置。
锐智转码参数说明
在创建自定义预设时,需要自定义参数,如视频编码格式、视频码率、视频宽高、音频编码格式、音频码率等。下面对各类型参数的关键参数含义及取值范围进行说明。
下面对各类型参数的关键参数含义及取值范围进行说明。
1. 基础参数
类别 | 中文名 | 参数名称 | 必填 | 参数侧边栏文案 |
---|---|---|---|---|
封装格式 | 封装格式 | Y | 封装格式支持以下几种: mp4、hls、flv、mov、gif、mp3、m4a | |
高质量 gif | /gifHighColor/<GIFHighColor> |
N | 输出为 gif 时,可以选择输出高画质的 gif 文件。 开启时,只支持与以下参数共用: 1、帧率(输出 gif 的帧数最多为 4500) 2、分辨率 3、片段截取 4、视频按比例缩放 |
|
转码时长 | 源视频时长 | /ss/<SeekStart> |
N | 默认是源文件时长。 |
片段截取开始时间 | /ss/<SeekStart> |
N | 如果只需要源文件中的一部分内容,可以选择片段截取来完成。 从输入源中截取一段音视频,指定截取开始时间,单位:秒。 |
|
片段截取长度 | /t/<Duration> |
N | 从输入源中截取一段音视频,指定截取的长度,单位:秒。 |
2. 视频参数
类别 | 中文名 | 参数名称 | 必填 | 说明 |
---|---|---|---|---|
禁用视频 | 禁用视频 | /vn/<VideoNo> |
N | 是否去除视频流,默认保留,勾选禁用视频后,会去除视频流。 |
编码格式 | 编码格式 | /vcodec/<VideoCodec> |
N | 视频编码格式,支持 H.264 和 H.265 两种,默认 H.264。 |
转码质量等级 | 转码质量等级 | /smtQuality/<quality> |
N | 瘦身时的转码质量等级,整数,取值范围[-7,9],值越大,画面越清晰。 |
码率 | 自定义码率 | /vb/<VideoBitRate> |
N | 1、视频码率,单位:千比特每秒(kbit/s),常用视频码率:128k,1.25m,5m等,码率限制大小为 [1,50000],支持到小数点后一位。 2、在不改变视频编码格式时,若指定码率大于原视频码率,则使用原视频码率进行转码。 3、可以强制使用指定码率转码, 使平均码率不高于指定值,会牺牲一些视频播放质量;不使用强制,会在码率与视频质量之间自动平衡。 |
最大平均码率 | /smtMaxvbr/<maxvbr> |
N | 最大平均码率, 单位:千比特每秒(kbit/s),常用视频比特率:128k 1.25m 5m 等。小于 1k 会默认使用 1k,取值为 [1,100000] ,支持到小数点后一位。 注:暂不支持输出为H265设置该参数。 |
|
分辨率 | 分辨率 | /s/<Resolution> |
N | 0、指定目标视频分辨率,格式为宽 x 高 ,长边取值范围[20,8192]的整数,短边取值范围[20,4320]的整数。 1、w、h 都为空时,则和原视频保持一致。 2、w为空,h不为空,则按h的值对原视频等比例缩放。 3、w不为空,h为空时,则按w的值对原视频等比例缩放。 4、w、h都不为空时,则根据w、h来缩放。 |
视频按比例缩放 | 视频按比例缩放 | /autoscale/<Autoscale |
N | 0、直接缩放时,会强制缩放到目标分辨率,可能造成视频变形。 1、裁剪缩放,原视频比例(A)和目标分辨率比例(B)进行比对,比例=宽/高; 1)若A<B,原视频按照目标分辨率的 高 进行缩放2)若A>B,原视频按照目标分辨率的{{宽}}进行缩放 2、补黑边调整,原视频比例(A)和目标分辨率比例(B)进行比对,比例=宽/高; 1)若A<B,原视频按照目标分辨率的 高 进行缩放,再放到目标分辨率矩形框内,并填充黑边2)若A>B,原视频按照目标分辨率的{{宽}}进行缩放,再放到目标分辨率矩形框内,并填充黑边。 示例:原视频(1280x 720),A(1.78);目标分辨率(800x400),B(2) 1)选择裁剪播放,A<B,此时按照 高 进行缩放,结果文件分辨率为710x400;2)选择补黑边调整,A<B,此时按照 高 进行缩放,原视频缩放为710x400,再放入800x400的矩形框,并填充黑边。 |
播放器显示比例 | 播放器显示比例 | /aspect/<Aspect> |
N | 该参数为视频在播放器中显示的宽高比,格式为<width>:<height>,取值范围为[1,100]的整数。 例如:取值3:4 表示视频在播放器中播放是宽:高 =3:4。 |
帧率 | 帧率 | /r/<FrameRate> |
N | 1、视频帧率,每秒显示的帧数,单位:赫兹(Hz),常用帧率:24,25,30帧等,帧率限制大小在 [1,60]。 2、普通帧率和高帧率的收费标准不同,参考价格详情。 帧率为为 [1,30]时,按照普通帧率进行收费。 帧率为 (30 , 60]的时,按照高帧率进行收费。 |
高帧率 | /hr/<HighFrameRate> |
N | 视频高帧率,与帧率配合使用,默认为不保留高帧率,即常规帧率,开启后表示保留高帧率。 1、不开启高帧率,帧率取值在[1,30]时,超出范围取25帧; 2、开启高帧率,取值[1,60],超出范围取60帧。 比如:设置帧率为45,不开启高帧率,实际帧率取25,开启高帧率,实际帧率取值45。 |
|
参考帧数量 | 参考帧数量 | /ref/<Ref> |
N | 设置参考帧数量,取值范围[1,16]。注:暂不支持输出为 libx265 设置该参数。 |
关键帧最大间隔 | 关键帧最大间隔 | /gop/<GroupOfPictures> |
N | GOP参数,即视频流关键帧间的间隔帧数,取值[0,3000]的整数。 1、不填或者取值为0,表示采用指定视频编码格式的默认GOP值(例如H264格式,默认GOP值为250)。 2、锐智转码1.0版本不支持该参数。 注意:GOP取值过小会影响视频编码压缩率,码率变大,过大会使图像群组的时长跨度过大,影响播放随机性,故一般建议采用默认值。 |
2.1 视频高级参数
类别 | 中文名 | 参数名称 | 必填 | 说明 |
---|---|---|---|---|
视频加减速 | 视频加减速 | /vspeed/<vspeed> |
N | 加/减速视频,默认为1,表示保持源视频速度不变。 1、加速,取值范围 [1,100],取值到小数点后两位 减速,取值范围 [0.01,1],取值到小数点后两位 2、减速,取值范围 [0.01,1],取值到小数点后两位 |
编码级别 | 编码级别 | /h264Profile/<H264Profile> |
N | H.264 规定了三种主要级别,不同硬件可播放的编码级别不同。当一个视频输出多清晰度时,建议: 1、最低清晰度设置适合移动设备(baseline) 2、其他清晰度设置为适合标准分辨率设备(main) 3、适合高分辨率设备(high) |
编码level | 编码level | /h264Level/<H264Level> |
N | 设置 h264 的 level 值,合法的值有 3.0、3.1、4.0、4.1、4.2。 |
视频颜色格式 | 视频颜色格式 | /pixFmt/<PixFmt> |
N | 指定视频像素格式,目前仅支持设置yuv420p。 |
HDR到SDR转化 | HDR到SDR变换 | /sdr/<SDR> |
N | 是否启用HDR转SDR。 1.当输入源为HDR时,开启时,转为SDR视频,不支持hdr的设备上也能尽可能还原hdr效果。 2.默认关闭,跟随源视频,即hdr到hdr,sdr到sdr。 备注: 不支持hdr的设备播放hdr视频,没有hdr效果。 |
视频旋转/翻转 | 顺时针旋转 | /rotate/<Degree> |
N | 指定顺时针旋转的度数,可取值为90 、180 、270 、auto ,默认为 auto。 |
视频翻转 | /flip/<Flip> |
N | 视频翻转, 水平翻转 horizontal , 垂直翻转 vertical。 |
|
视频马赛克 | 马赛克位置 | /mosaicGravity/<MosaicGravity> |
N | 马赛克的位置,参考锚点参数表,默认值为NorthEast (右上角) |
马赛克位置 | /mosaicOffsetX/<MosaicOffsetX> |
N | 马赛克位置的相对横向偏移量 ,正数则向右偏移,负数向左偏移。 |
|
马赛克位置 | /mosaicOffsetY/<MosaicOffsetY> |
N | 马赛克位置的相对纵向偏移量 ,正数则向下偏移,负数向上偏移。 |
|
马赛克大小 | /mosaicSize/<MosaicSize> |
N | 马赛克区域大小,即指定马赛克的宽和高。 | |
起始时间 | /mosaicStart/<MosaicStart> |
N | 马赛克起始时间, 默认为0。 | |
持续时间 | /mosaicDuration/<MosaicDuration> |
N | 马赛克持续时间, 默认直到片尾 | |
清除metadata | 清除metadata | /stripmeta/<StripMeta> |
N | 是否清除文件的metadata ,1为清除,0为保留。 |
3. 音频参数
分类 | 中文名 | 参数名称 | 必填 | 说明 |
---|---|---|---|---|
禁用音频 | 禁用音频 | /an/<AudioNo> |
N | 是否去除音频流,0为保留,1为去除。默认值为0。 |
编码格式 | 编码格式 | /acodec/<AudioCodec> |
N | 1、音频编码格式,支持 MP3 、AAC 。 2、为空时,与源视频一致 |
编码级别 | 编码级别 | /audioProfile/<profile> |
N | AAC音频编码级别,支持:aac_he。需配合 aac 编码方案使用,如 avthumb/m4a/acodec/libfdk_aac/audioProfile/aac_he。 |
采样率 | 采样率 | /ar/<SamplingRate> |
N | 1、音频采样频率,单位:赫兹(Hz),取值为整数。 2、常用音频采样频率有 8000, 11025、12000、16000、22050、24000、32000、44056、44100、47250、48000、50000、64000、88200、96000 等。 |
码率 | 自定义码率 | /ab/<BitRate> |
N | 1、音频码率,单位:比特每秒(kbit/s),常用码率:64k,128k,192k,256k,320k等,音频码率限制大小为 [1,600],支持到小数点后一位。 2、在不改变音频编码格式时,若指定码率大于原音频码率,则使用原音频码率进行转码。 3、勾选【强制使用】,可以强制指定码率进行转码。 |
音频质量因子 | /aq/<AudioQuality> |
N | 设置音频质量因子,其值越小,输出音频质量越好。 1、mp3取值范围:0-9 2、aac取值范围:10-500 |
|
声道数 | 声道数 | /ac/<ChannelNum> |
N | 音频声道数量,单位:整数值,输出文件的声道数不能大于输入源的声道数量; 1、音频编码格式为mp3时,支持的声道数量为 1、2,其他数值不合法。 2、音频编码格式为aac时,支持的声道数量为 1、2、4、5、6、8,其他数值不合法; |
音量设置 | 源视频音量 | 默认跟随源视频音量 | ||
音量调节 | /volume/<Volume> |
N | 1、调整音频音量为原音频音量的倍数, 精确到小数点后2位 ,默认值为 1.0, 范围 [0.01, 3]; 2、不可与【音频响度标准化】共用。 |
|
音量响应度 | /loudnorm/<LoudNorm> |
N | 1、是否使用音频响度标准化调整,0为不使用,1为使用。默认值为0; 2、不可与volume共用。 |
|
/loudnormI/<LoudNormI> |
N | 音频整体响度值,当 loudnorm 为1时有效,取值范围 [-70.0, -5.0], 默认为 -24.0 | ||
/loudnormLRA/<LoudNormLRA> |
N | 音频响度范围,当 loudnorm 为1时有效, 取值范围 [1.0, 20.0], 默认为 7.0 | ||
/loudnormTP/<LoudNormTP> |
N | 音频最高峰值,当 loudnorm 为1时有效, 取值范围 [-9.0, 0.0], 默认为 -2.0 | ||
/loudnormRefine/<LoudNormRefine |
N | 使用增强音频响度标准化(/loudnormRefine/<LoudNormRefine),可以尽量让不同轨道的音量保持一致,分为: 1、音频优先,会严格按照用户的参数配置响度。 2、使用响度优先,会有一些限制不一定能达到用户配置的响度值。 |
||
/loudnormF/<LoudNormF> |
N | 音量均衡,可以解决单个文件音频中存在音量忽大忽小的问题,比如一个音频前面几秒跟后面几秒声音听起来大小不同。 1、设置片段时长大小(/loudnormF/ 2、设置平滑窗口大小(/loudnormG/ |
||
/loudnormG/<LoudNormG> |
N | 同上 |
3.1 音频高级参数
类别 | 中文名 | 参数名称 | 必填 | 说明 |
---|---|---|---|---|
音频混音 | 混音文件 | /amix/<AmixURL> |
N | 1、期望混音的音视频文件;2、源音视频、混音文件都仅支持单音轨;3、混音的两个音频的 channel 数必须一致。备注:不支持与音频替换同时使用。 |
开始混音时间 | /amixOffset/<AmixOffset> |
N | 混音效果起始位置,相对于混音后视频起始位置计算,单位为秒,精确到毫秒,默认取0,即混音后音视频从起始位置起有混音效果 | |
混音文件截取开始时间 | /amixStart/<AmixStart> |
N | 1、用于混音文件长度截取;2、混音文件截取的开始时间,单位为秒,精确到毫秒;3、默认值为0,即混音文件从起始混入源音视频。 | |
混音文件截取时长 | /amixDuration/<AmixDuration> |
N | 1、用于混音文件长度截取;2、混音文件截取的时长,单位为秒,精确到毫秒;3、默认为目标混音文件音轨原始长度,即全部混入源音视频。 | |
音频替换 | 替换文件 | /multiArep/<MultiAudioReplaceURL> |
N | 用于替换原视频音频的音频文件。备注:不支持与音频混音同时使用。 |
开始替换时间 | /multiArepOffset/<MultiAudioReplaceOffset> |
N | 音频替换起始位置,相对于原视频音频起始位置计算,单位为秒,精确到毫秒,默认取0 | |
替换文件截取开始时间 | /multiArepStart/<MultiAudioReplaceStart> |
N | 1、用于替换文件长度截取;2、替换文件截取的开始时间,单位为秒,精确到毫秒;3、默认值为0,即替换文件从起始混入源音视频。 | |
替换文件截取时长 | /multiArepDuration /<MultiAudioReplaceDuration> |
N | 目标音频文件截取的时长,单位为秒,精确到毫秒,默认为目标音频文件音轨原始长度,即全部目标音频替换原视频音频。 |
4. 字幕编辑
中文名 | 参数名称 | 必填 | 说明 |
---|---|---|---|
禁用字幕 | /sn/<SubtitleNo> |
N | 是否去除字幕,0为保留,1为去除。默认值为0。 |
添加字幕 | /subtitle/<SubtitleURL> |
N | 添加字幕,支持:srt格式字幕(uft-8编码和和utf-8 BOM编码)、带有字幕的mkv文件、embed(将原视频的字幕流嵌入目标视频)。基于base64编码。 |
文档反馈
(如有产品使用问题,请 提交工单)