数字人声音采集指南
您好,欢迎使用七牛云智能数字人服务,本指南将协助您完成数字人声音的采集工作。
请注意,数字人声音生成的效果与您的录制效果有较大关联,为了获取更好的数字人效果,我们建议您严格按照以下标准进行录制
音频总时长为 15 ~ 30 分钟,建议 20 分钟
录制前
录制设备和软件
- 优先使用专业录音设备录制音频,可以从网上下载类似 Adobe Audition 的软件进行录音;如果条件不允许,也可以通过手机进行录制,可以从网上下载类似 简易录音机(Easy Voice
Recorder) for IOS 系统,超级录音机 for Android 系统的软件进行录制- 采样率:推荐使用 48kHz 采样率录制音频
- 采样位:推荐 24 bit 或者 16 bit
- 声道:推荐使用单声道录制音频
- 如果你有专业录音棚 + 高保真 MIC 录制那就更好了
- 切勿佩戴耳机进行录制
录音环境
- 录音环境应保持安静,无回音、混响或噪声,避免出现汽车鸣笛、他人说话、走动、桌子移动等干扰声
- 避免在大会议室或过于空旷的房间等地方录制。
- 为确保数据一致性,建议在调试好录制环境后,在同一时间段内完成所有录制
录制中
录制事项 | 说明 |
---|---|
麦克风距离 | 嘴巴与麦克风保持两个拳头(10cm)左右的距离 |
发音 | 确保发音清晰、准确 |
语速 | 保持自然、平稳的语速,避免过快或过慢、忽快忽慢 |
音量 | 音量应适中,避免过小或过大,或音量忽大忽小 |
停顿 | 在标点或适当的断句处自然停顿,轻声换气 |
风格 | 全程保持一致的风格,与实际使用场景的声音风格相符 |
阅读发音 | 按顺序阅读,确保音字一致。避免漏字、添字、发音错误或不流畅的情况,如出现这些问题,需整句重新录制 |
录制后
- 建议使用无损音质格式保存音频文件,如 wav、m4a 格式
声音授权
根据相关部门的要求,所有声音克隆操作必须获得本人授权。请在完成声音采集后,额外录制一段确认音频,内容如下:我(发音人姓名)确认我的声音将会被七牛云使用于创建合成版本语音。
数字人声音采集演讲稿
文档反馈
(如有产品使用问题,请 提交工单)