智能多媒体服务 > 产品简介 > 功能特性

功能特性

最近更新时间: 2026-04-30 18:09:58

智能多媒体服务的核心能力特性如下所示：

转码

类别	说明
封装格式	封装格式，具体细节请参考支持转换的封装格式。
转封装	不改变视频的编码方式，仅改变封装格式。支持音视频转封装为 MP4、M3U8、FLV 等格式。
视频编码	编码标准：h264、h265，默认为h264。具体细节请参考支持转换的视频编码格式。
音频编码	默认值：AAC。具体细节请参考支持转换的音频编码格式。

视频编辑

类别	说明
视频水印	支持在输出的视频上最多覆盖20个图片和文字水印。注：支持png、jpg、gif、apng 图片格式。
音视频拼接	用于将指定的数个音频片段拼接成一段音频，或者将数个视频片段拼接成一段视频。
添加字幕	支持 srt格式字幕、带有字幕的mkv文件、embed（将原视频的字幕流嵌入目标视频）。
添加混音	在原视频中加入期望的音视频文件。
替换音频文件	用于替换原视频中音频的目标音频文件。
添加马赛克	支持对视频特定位置进行马赛克处理。
去除音频	支持从视频文件中去除音频流。
去除视频	支持从视频文件中去除视频流。
去除字幕	支持从视频文件中去除字幕。
去除媒体流	从输入源中选择要保留的或者要去除的媒体流，流的编号可以通过 avinfo 来查看。

视频截图

类别	说明
视频帧缩略图	用于从视频流中截取指定时刻的单帧画面并按指定大小缩放成图片。对存储于 kodo 上的视频文件截取指定时间的JPG、PNG 格式图像。
视频采样缩略图	用于从视频文件中截取多帧画面并按指定大小缩放成图片。输出的目标截图格式，支持 JPG、PNG 等。

锐智转码

功能	说明
锐智转码	1.节省带宽：融合感知编码、深度学习、图像处理、画质增强等技术，在保证画质的前提下，节省 20% 以上码率，为用户降低成本。 2.视频编码技术：根据视频内容自适应码率以及自适应分辨率，不同场景可以适配最优的算法提升压缩和画质效果，追求最佳的收益效果。 3.提升画质：AI 视频前处理包括：去编码脏效应、去燥、去毛刺、锐化、饱和度增强、去模糊等，并引入 Vmaf 和 Mos 质量评价体系，提升视频主观画质。 4.精细处理：ROI 感兴趣区域识别，包括人脸、人眼聚焦、前景重点区域、及各个块的主观敏感度，对用户关注区域进行动态编码。

倍速转码

功能	说明
倍速转码	加速对视频资源进行编码。适用于25分钟以上的长视频，通过对视频分片并行转码，大幅提升转码速度，转码速度可提升3倍。

其他音视频功能

类别	说明
音视频分段	用于按时长或时间点对原视频分段，不改变原音/视频的编码格式、分辨率、码率等，将原音/视频切成多个较小的文件。注:如果原音视频文件的编码格式无法封装到目标封装格式，那么会返回错误。
音视频切片	用于支持 HTTP Live Streaming播放。 HTTP Live Streaming 是由 Apple 提出的基于 HTTP 的流媒体传输协议。它将一整个音频、视频流切割成可由 HTTP 下载的一个个小的音视频流，并生成一个 M3U8 播放列表，客户端只需要获取资源的 M3U8 播放列表即可播放音视频。
音视频元信息	用于获取指定音频、视频资源的元信息。视频信息包括：编码标准、分辨率（宽/高）、码率、帧率等；音频信息包括：编码标准、声道、采样率、码率等。
实时音视频转码	用于对已经上传到七牛云的音频、视频，在终端播放时按照指定参数进行实时转码。注意：该功能目前支持华东和华北的 bucket。
多码率自适应转码	用于对已经上传到七牛云的视频转码成包含多种码率的HLS视频流。以便能随着终端网络带宽的变化动态选择适应的码率播放。
私有M3U8	只能用于私有空间中的 m3u8 文件，作用是对 m3u8文件中的 ts 资源进行批量下载授权。通过将 ts 资源的 url 改写成私有 url，以临时获取访问权限。

图片处理

功能	说明
图片基本处理	可对图片进行缩略操作，生成各种缩略图。 imageView2 接口可支持处理的原图片格式有 psd、jpeg、png、gif、webp、tiff、bmp。
图片高级处理	提供了一系列高级图片处理功能，包括缩放、裁剪、旋转等。 imageMogr2 接口可支持处理的原图片格式有 psd、jpeg、png、gif、webp、tiff、bmp。
图片瘦身	将存储在七牛的JPEG、PNG格式的图片实时压缩而尽可能不影响画质。降低CDN分发成本加快客户端图片的加载速度，提升用户体验。
图片基本信息	可以获取图片格式、大小、色彩模型信息。在图片下载 URL 后附加 imageInfo 指示符（区分大小写），即可获取 JSON 格式的图片基本信息。
图片水印处理	提供四种水印接口：图片水印、文字水印，文字平铺水印、混合水印。
盲水印处理	为原图添加不可见水印，不影响原图质量。支持图片盲水印和文字盲水印。
图片EXIF信息	专门为数码相机的照片设定的可交换图像文件格式，通过在图片下载URL后附加exif指示符（区分大小写）获取。
图片圆角处理	将图片生成圆角图片，并且可以指定图片的圆角大小。这个接口支持的原图片格式有png、jpg，处理后的图片格式为png。
图片平均色调	用于计算一幅图片的平均色调，并以0xRRGGBB形式返回。
动图合成	用于将多张图片合成 GIF 动图。支持处理的原图片格式有 jpeg 和 png。

文件处理

功能	说明
文件HASH值	用于实时得到存储在七牛的文件的HASH值。目前支持华东、华南、华北三个区域的存储 bucket。
文本文件合并	用于将数个七牛云上的源文件的二进制内容按指定顺序合并到新文件。不能用于音视频拼接和图片拼接。
多文件压缩	为用户提供了批量文件的压缩存储功能。
MD转HTML	支持直接将七牛云存储上的 Markdown 类型的资源转为 HTML 文件并返回。
资源下载二维码	用于为存放在七牛云存储上的资源的下载URL或资源内容生成二维码图片，方便用户在各种客户端之间传播资源。所生成的二维码图片格式为png。

内容安全

类别	说明
图片内容审核	主要用于检测或识别图片中的不良信息，并给出审核结果管控建议。支持的审核类型包括： 1. 图片鉴黄 2. 图片鉴暴恐 3. 图片敏感人物识别 4. 图片广告识别。
视频内容审核	主要用于检测或识别视频中的不良信息，并给出审核结果管控建议支持的审核类型包括： 1. 视频鉴黄 2. 视频鉴暴恐 3. 视频敏感人物识别。

内容识别#

类别	说明
OCR身份证识别	对存储在七牛云 bucket（支持华东、华北和华南 bucket）或非七牛云 bucket 的身份证正反面图片进行智能识别，可得到身份证中姓名、性别、民族、住址和身份证号码等关键信息。目前支持的图片格式有 png、jpg 和 bmp。
人脸识别	业界领先的人脸检测、五官关键点定位、人脸属性分析和快速的人脸聚类功能，包括以下能力： 1. 人脸检测 2. 1:1人脸比对 3. 1:N人脸比对。

第三方服务

类别	服务提供商	说明
图片鉴黄	图普科技	能够帮您有效判断保存在七牛云存储的空间中的图片是属于色情、性感还是正常。关于接口的详细信息请参阅图普科技图片鉴黄服务。
图片鉴暴恐	图普科技	帮您识别保存在七牛云空间中的图片是属于暴恐还是非暴恐，并给出判断分数。关于接口的详细信息请参阅图普科技图片鉴暴恐服务。
短视频鉴黄	图普科技	能够帮您有效判断保存在七牛云的视频是属于色情，性感还是正常。关于接口的详细信息请参阅图普科技视频鉴黄服务。
图片广告过滤	图普科技	帮您判断保存在七牛云的图片是否属于广告。关于接口的详细信息请参阅图普科技广告过滤服务。
广告过滤增强版	图普科技	能够帮您有效判断保存在七牛云的带文字图片是否属于广告，如果图片被识别为带有文字，会将对应的文字内容识别出来反馈给您，可以方便的根据文本信息去判断是否是广告内容。关于接口的详细信息请参阅图普科技广告过滤服务增强版。
垃圾评论过滤	达观数据	能够帮您有效判断保存在七牛云的文本是否属于广告以及文本质量如何。关于接口的详细信息请参阅达观垃圾评论过滤服务。
文本鉴黄鉴政	达观数据	能够帮您有效判断保存在七牛云的文本是属于色情、政治违规还是正常。关于接口的详细信息请参阅达观数据文本鉴黄鉴政服务。
文本反垃圾	阿里	能够有效帮助您检测出您的文本中是否存在违规的风险内容，高效过滤色情、广告、涉政、暴恐等多类垃圾文字及敏感词。关于接口的详细信息请参阅阿里文本反垃圾服务。
图片广告审核	阿里	能够有效帮助您检测出您的图片中是否存在违规的风险内容，识别图片中的广告以及文字违规信息。关于接口的详细信息请参阅阿里图片广告审核服务。
语音审核	阿里	能够有效帮助您检测出您的音视频中的语音是否存在违规的风险内容。关于接口的详细信息请参阅阿里音频审核服务。
风格迁移	versa	能够有效的将图片与风格转换成目标图片风格。关于接口的详细信息请参阅[versa 风格迁移服务]( (/dora/api/6293/marca-dragon-style-transfer-service) 。
人像分割	versa	能够帮您有效的把图片中人物与背景单独分离开。关于接口的详细信息请参阅versa 人像分割。
实例分割	versa	有效的将图片中不同实例分别与背景分离。关于接口的详细信息请参阅versa 人像分割。
智能填充	versa	有效的将图像中的指定区域进行修复重建或者去除图像中的多余物体。关于接口的详细信息请参阅versa 智能填充。

以上内容是否对您有帮助？