锐智转码,即通过智能动态编码和画质增强技术,对视频内容进行自适应转码,在不损失画质的情况下(肉眼无感知),实现视频转码的质量更高和输出视频体积更小的兼得,适用于有降低成本且保证画质清晰度的场景。
应用用场景
锐智高清的智能自适应目标是在不同场景下匹配最优的算法,追求最佳的收益效果。
- 以在线教育场景为例,屏幕录制为视频主要内容,针对屏幕内容采用特定算法可取得有效的针对性提升;
- 秀场场景,算法会更倾向于人脸和细节上的优化;
- 体育场景,运动目标检测和去运动模糊是主要关注点。
锐智转码自定义预设
-
登录 对象存储,选择具体空间,左侧导航栏点击【任务与工作流 -> 预设集管理】,切换到【锐智转码】列表页面。
-
点击右上角的 新建预设 按钮。
-
进入 添加锐智转码预设页,配置相关参数,包括基础参数、视频参数、音频参数、字幕参数。
-
单击保存,完成锐智预设的创建。
创建成功后,您可以在自定义预设列表中对新建的预设进行 查看、编辑、复制、删除 操作。
详细参数说明如下表所示
在创建自定义预设时,需要自定义参数,如视频编码格式、视频码率、视频宽高、音频编码格式、音频码率等。下面对各类型参数的关键参数含义及取值范围进行说明。
1. 基础参数
类别 | 中文名 | 参数名称 | 必填 | 参数侧边栏文案 |
---|---|---|---|---|
封装格式 | 封装格式 | Y | 封装格式支持:mp4、hls、flv、mov | |
ts文件名 | /savePattern/<savePattern> |
N | 为各音视频流ts文件自定义命名。 因为一整段音视频流音视频切片后会生成一个M3U8播放列表和多个默认命名的音视频流ts文件。 命名支持使用变量: 1. 可以使用 $(变量名) 或${变量名} 形式求值,魔法变量使用说明,参考 文件名变量 。2. 注意: $(count) 为必填项,必须存在的六位占位符数字串。示例: 输出的m3u8文件名为: output.m3u8 ,cmd为:avthumb/m3u8/noDomain/1/savePattern/JChzYXZlYXMua2V5UHJlZml4KSAkKGNvdW50KS50cw== ,其中 JChzYXZlYXMua2V5UHJlZml4KSAkKGNvdW50KS50cw== 是自定义 ts 文件名,$(saveas.keyPrefix) $(count).ts 的URL安全的Base64编码。最后得到类似:output000000.ts,output000001.ts,……,output000006.ts 命名的 ts 文件,跟输出的m3u8文件是关联的。 |
|
转码时长 | 源视频时长 | N | 默认是源文件时长。 | |
片段截取 | /ss/<SeekStart> |
N | 片段截图开始时间,如果只需要源文件中的一部分内容,可以选择片段截取来完成。 从输入源中截取一段音视频,指定截取开始时间,单位:秒。 |
|
/t/<Duration> |
N | 片段截图时长,从输入源中截取一段音视频,指定截取的长度,单位:秒。 |
2. 视频参数
类别 | 中文名 | 参数名称 | 必填 | 说明 |
---|---|---|---|---|
禁用视频 | 禁用视频 | /vn/<VideoNo> |
N | 是否去除视频流,默认保留,勾选禁用视频后,会去除视频流。 |
编码格式 | 编码格式 | /vcodec/<VideoCodec> |
N | 视频编码格式,支持 H.264 和 H.265 两种,默认 H.264。 |
转码质量等级 | 转码质量等级 | /smtQuality/<quality> |
N | 瘦身时的转码质量等级,默认不开启,开启后下拉选择,取值范围[-7,9]的整数,值越大,画面越清晰。 |
码率 | 自定义码率 | /vb/<VideoBitRate> |
N | 选择自定义码率。 1、视频码率,单位:千比特每秒(kbit/s),常用视频码率:128k,1.25m,5m等,码率限制大小为 [1,50000],支持到小数点后一位。 2、在不改变视频编码格式时,若指定码率大于原视频码率,则使用原视频码率进行转码。 3、可以强制使用指定码率转码, 使平均码率不高于指定值,会牺牲一些视频播放质量;不使用强制,会在码率与视频质量之间自动平衡。 |
最大平均码率 | /smtMaxvbr/<maxvbr> |
N | 选择最大平均码率。 单位:千比特每秒(kbit/s),常用视频比特率:128k 1.25m 5m 等。小于 1k 会默认使用 1k,取值为 [1,100000] ,支持到小数点后一位。注:暂不支持输出为H265设置该参数。 |
|
分辨率 | 分辨率 | /s/<Resolution> |
N | 指定目标视频分辨率,格式为宽 x 高 ,长边取值范围[20,8192]的整数,短边取值范围[20,4320]的整数。 1、默认跟源视频保持一致。 2、w为空,h不为空,则按h的值对原视频等比例缩放。 3、w不为空,h为空时,则按w的值对原视频等比例缩放。 4、w、h都不为空时,则根据w、h来缩放。 |
视频按比例缩放 | 视频按比例缩放 | /autoscale/<Autoscale |
N | 0、默认为【直接缩放】,会强制缩放到输出分辨率,原视频比例(A)和输出分辨率比例(B)不等时,可能造成视频变形。 1、可选择【裁剪缩放】,原视频比例(A)和输出分辨率比例(B)不等时,对输出分辨率做相应调整,保证转码后视频不变形: a. 若A<B,原视频按照输出分辨率的 高 进行缩放 b. 若A>B,原视频按照输出分辨率的 宽 进行缩放2、可选择【补黑边缩放】,原视频比例(A)和输出分辨率比例(B)不等时,设置 autoscale/2 ,对输出分辨率做相应调整,保证转码后视频不变形:a. 若A<B,原视频按照输出分辨率的 高 进行缩放,再放到输出分辨率矩形框内,并填充黑色 b. 若A>B,原视频按照输出分辨率的 宽 进行缩放,再放到输出分辨率矩形框内,并填充黑色。 参数使用图示: |
播放器显示比例 | 播放器显示比例 | /aspect/<Aspect> |
N | 默认为源视频宽高比。 该参数为视频在播放器中显示的宽高比,格式为 <width>:<height>,取值范围为[1,100]的整数。 例如:取值3:4 表示视频在播放器中播放是宽:高 =3:4。 |
帧率 | 帧率 | /r/<FrameRate> |
N | 1、视频帧率,每秒显示的帧数,单位:赫兹(Hz),常用帧率:24,25,30帧等,帧率限制大小在 [1,60],默认为源视频帧率。 2、普通帧率和高帧率的收费标准不同,参考价格详情。 帧率为为 [1,30]时,按照普帧进行收费。 帧率为 (30 , 60]的时,按照高帧进行收费。 |
保留高帧率 | /hr/<HighFrameRate> |
N | 视频高帧率,与视频帧率配合使用,默认为不保留高帧率,即常规帧率,开启后表示保留高帧率。 1、不开启高帧率,帧率取值在[1,30]时,超出范围取25帧; 2、开启高帧率,取值[1,60],超出范围取60帧。 比如:设置帧率为45,不开启高帧率,实际帧率取25,开启高帧率,实际帧率取值45。 |
|
关键帧最大间隔 | 关键帧最大间隔 | /gop/<GroupOfPictures> |
N | GOP参数,即视频流关键帧间的间隔帧数,取值[0,3000]的整数。 不填或者取值为0,表示采用指定视频编码格式的默认GOP值(例如H264格式,默认GOP值为250)。 |
2.1 视频高级参数
类别 | 中文名 | 参数名称 | 必填 | 说明 |
---|---|---|---|---|
视频加减速 | 视频加减速 | /vspeed/<vspeed> |
N | 视频加/减速,默认保持源视频速度不变。 1、加速,取值范围 [1,100],取值到小数点后两位 减速,取值范围 [0.01,1],取值到小数点后两位 2、减速,取值范围 [0.01,1],取值到小数点后两位 |
编码级别 | 编码级别 | /h264Profile/<H264Profile> |
N | 默认跟随源视频,H.264 规定了三种主要级别,不同硬件可播放的编码级别不同。当一个视频输出多清晰度时,建议: 1、最低清晰度设置适合移动设备(baseline) 2、其他清晰度设置为适合标准分辨率设备(main) 3、适合高分辨率设备(high) |
编码level | 编码level | /h264Level/<H264Level> |
N | 默认跟随源视频,设置 h264 的 level 值,合法的值有 3.0、3.1、4.0、4.1、4.2。 |
视频颜色格式 | 视频颜色格式 | /pixFmt/<PixFmt> |
N | 默认跟随源视频,指定视频像素格式,目前仅支持设置yuv420p。 |
HDR到SDR转化 | HDR到SDR变换 | /sdr/<SDR> |
N | 1.默认关闭,跟随源视频。 2.当输入源为HDR时,开启时,转为SDR视频,不支持hdr的设备上也能尽可能还原hdr效果。注意: 不支持hdr的设备播放hdr视频,没有hdr效果。 |
视频旋转/翻转 | 顺时针旋转 | /rotate/<Degree> |
N | 默认跟随源视频,指定顺时针旋转的度数,可取值为90 、180 、270 、auto ,默认为 auto。 |
视频翻转 | /flip/<Flip> |
N | 默认跟随源视频,视频翻转, 水平翻转 horizontal , 垂直翻转 vertical。 |
|
视频马赛克 | 马赛克位置 | /mosaicGravity/<MosaicGravity> |
N | 马赛克的位置,参考锚点参数表,默认值为NorthEast (右上角) |
马赛克位置 | /mosaicOffsetX/<MosaicOffsetX> |
N | 马赛克位置的相对横向偏移量 ,正数则向右偏移,负数向左偏移。 |
|
马赛克位置 | /mosaicOffsetY/<MosaicOffsetY> |
N | 马赛克位置的相对纵向偏移量 ,正数则向下偏移,负数向上偏移。 |
|
马赛克大小 | /mosaicSize/<MosaicSize> |
N | 马赛克区域大小,即指定马赛克的宽和高。 | |
起始时间 | /mosaicStart/<MosaicStart> |
N | 马赛克起始时间, 默认为0。 | |
持续时间 | /mosaicDuration/<MosaicDuration> |
N | 马赛克持续时间, 默认直到片尾 | |
清除metadata | 清除metadata | /stripmeta/<StripMeta> |
N | 默认保留,是否清除文件的metadata ,1为清除,0为保留。 |
3. 音频参数
分类 | 中文名 | 参数名称 | 必填 | 说明 |
---|---|---|---|---|
禁用音频 | 禁用音频 | /an/<AudioNo> |
N | 默认关闭,即保留音频流;开启,则去除音频流。 |
编码格式 | 编码格式 | /acodec/<AudioCodec> |
N | 音频编码格式,可选择项: MP3 、AAC ,默认为AAC。 |
编码级别 | 编码级别 | /audioProfile/<profile> |
N | AAC音频编码级别,支持:aac_he。需配合 aac 编码格式使用。 |
采样率 | 采样率 | /ar/<SamplingRate> |
N | 1、音频采样频率,单位:赫兹(Hz),取值为整数。 2、常用音频采样频率有 8000, 11025、12000、16000、22050、24000、32000、44056、44100、47250、48000、50000、64000、88200、96000 等。 |
码率 | 自定义码率 | /ab/<BitRate> |
N | 1、音频码率,单位:比特每秒(kbit/s),常用码率:64k,128k,192k,256k,320k等,音频码率限制大小为 [1,600],支持到小数点后一位。 2、在不改变音频编码格式时,若指定码率大于原音频码率,则使用原音频码率进行转码。 3、勾选【强制执行】,可以强制指定码率进行转码。 |
音频质量因子 | /aq/<AudioQuality> |
N | 设置音频质量因子,其值越小,输出音频质量越好。 1、mp3取值范围:0-9 2、aac取值范围:10-500 |
|
声道数 | 声道数 | /ac/<ChannelNum> |
N | 音频声道数量,单位:整数值,输出文件的声道数不能大于输入源的声道数量; 1、音频编码格式为mp3时,支持的声道数量为 1、2,其他数值不合法。 2、音频编码格式为aac时,支持的声道数量为 1、2、4、5、6、8,其他数值不合法; |
音量设置 | 源视频音量 | 默认跟随源视频音量 | ||
音量调节 | /volume/<Volume> |
N | 选择【音量调节】,调整音频音量为原音频音量的倍数, 精确到小数点后2位 ,默认值为 1.0, 范围 [0.01, 3]; |
|
音量响应度 | 选择【音量响应度】,有2种方式可以选择: 1.增强响度标准化,默认关闭 2.音量均衡,默认关闭 |
|||
/loudnormRefine/<LoudNormRefine |
N | 默认关闭,开启后使用**【增强音频响度标准化】**,可以尽量让不同轨道的音量保持一致,可选项有两种: 1、音频优先,会严格遵循用户配置的响度值。 2、使用响度优先,会有一些限制不一定能达到用户配置的响度值。 注意:使用 loudnormRefine 时,推荐不设置 loudnormLRA 和 loudnormTP 。 |
||
/loudnormF/<LoudNormF> /loudnormG/<LoudNormG> |
默认关闭,开启后使用**【音量均衡】**,可以解决单个文件音频中存在音量忽大忽小的问题,比如一个音频前面几秒跟后面几秒声音听起来大小不同。 1、设置片段时长大小,即 /loudnormF ,单位:毫秒,取值范围 [10, 8000],取值越小拉平越明显,默认为 500。2、设置平滑窗口大小,即 loudnormG ,单位:帧,取值范围为 [3, 301]的奇数, 取值越小拉平越明显,默认为 31 |
|||
/loudnormI/<LoudNormI> |
N | 响度值,取值范围 [-70.0, -5.0], 默认为 -24.0 | ||
/loudnormLRA/<LoudNormLRA> |
N | 响度范围, 取值范围 [1.0, 20.0], 默认为 7.0 | ||
/loudnormTP/<LoudNormTP> |
N | 最高峰值, 取值范围 [-9.0, 0.0], 默认为 -2.0 |
3.1 音频高级参数
类别 | 中文名 | 参数名称 | 必填 | 说明 |
---|---|---|---|---|
音频替换 | 替换文件 | /multiArep/<MultiAudioReplaceURL> |
N | 默认不开启,开启后进行音频替换配置。 用于替换原视频音频的音频文件,不支持与音频混音同时使用。 |
开始替换时间 | /multiArepOffset/<MultiAudioReplaceOffset> |
N | 音频替换起始位置,相对于原视频音频起始位置计算,单位为秒,精确到毫秒,默认取0 | |
替换文件截取开始时间 | /multiArepStart/<MultiAudioReplaceStart> |
N | 1、用于替换文件长度截取;2、替换文件截取的开始时间,单位为秒,精确到毫秒;3、默认值为0,即替换文件从起始混入源音视频。 | |
替换文件截取时长 | /multiArepDuration /<MultiAudioReplaceDuration> |
N | 目标音频文件截取的时长,单位为秒,精确到毫秒,默认为目标音频文件音轨原始长度,即全部目标音频替换原视频音频。 | |
音频混音 | 混音文件 | /amix/<AmixURL> |
N | 默认不开启,开启后进行音频混音配置。 1、期望混音的音视频文件;2、源音视频、混音文件都仅支持单音轨;3、混音的两个音频的 channel 数必须一致。备注:不支持与音频替换同时使用。 |
开始混音时间 | /amixOffset/<AmixOffset> |
N | 混音效果起始位置,相对于混音后视频起始位置计算,单位为秒,精确到毫秒,默认取0,即混音后音视频从起始位置起有混音效果 | |
混音文件截取开始时间 | /amixStart/<AmixStart> |
N | 1、用于混音文件长度截取;2、混音文件截取的开始时间,单位为秒,精确到毫秒;3、默认值为0,即混音文件从起始混入源音视频。 | |
混音文件截取时长 | /amixDuration/<AmixDuration> |
N | 1、用于混音文件长度截取;2、混音文件截取的时长,单位为秒,精确到毫秒;3、默认为目标混音文件音轨原始长度,即全部混入源音视频。 | |
支持speex文件 | 支持speex文件 | /speex/<Speex> |
N | 默认关闭,不作为微信speex处理;开启后把源音频文件作为微信版speex处理。版本为1.2rc1,不支持其他音频格式转speex。 |
Xing信息 | Xing信息 | /writeXing/<Xing> |
N | 默认开启,开启表示将转码成mp3时写入xing 。 写入会导致 file,avinfo 等命令识别出错误的码率。好处是在需要音频时长、帧数的时候只需要获取header。 关闭时,表示不写入。 |
4. 字幕编辑
中文名 | 参数名称 | 必填 | 说明 |
---|---|---|---|
禁用字幕 | /sn/<SubtitleNo> |
N | 默认关闭,表示保留字幕,开启后去除字幕。 |
添加字幕 | /subtitle/<SubtitleURL> |
N | 添加字幕,先选择空间,选择字幕文件,支持:srt格式字幕(uft-8编码和和utf-8 BOM编码)、带有字幕的mkv文件、embed(将原视频的字幕流嵌入目标视频)。 |
锐智转码预设使用
您可以直接使用自定义预设,将其添加至工作流模板中,用于后续的任务处理。
文档反馈
(如有产品使用问题,请 提交工单)