智能数字人

  • 智能数字人 > 使用指南 > 形象和声音录制手册 > 数字人声音采集指南

    数字人声音采集指南

    最近更新时间: 2024-09-25 16:54:48

    数字人声音采集指南

    您好,欢迎使用七牛云智能数字人服务,本指南将协助您完成数字人声音的采集工作。

    请注意,数字人声音生成的效果与您的录制效果有较大关联,为了获取更好的数字人效果,我们建议您严格按照以下标准进行录制

    音频总时长为 15 ~ 30 分钟,建议 20 分钟

    录制前

    录制设备和软件

    • 优先使用专业录音设备录制音频,可以从网上下载类似 Adobe Audition 的软件进行录音;如果条件不允许,也可以通过手机进行录制,可以从网上下载类似 简易录音机(Easy Voice
      Recorder)
      for IOS 系统,超级录音机 for Android 系统的软件进行录制
      • 采样率:推荐使用 48kHz 采样率录制音频
      • 采样位:推荐 24 bit 或者 16 bit
      • 声道:推荐使用单声道录制音频
    • 如果你有专业录音棚 + 高保真 MIC 录制那就更好了
    • 切勿佩戴耳机进行录制

    录音环境

    • 录音环境应保持安静,无回音、混响或噪声,避免出现汽车鸣笛、他人说话、走动、桌子移动等干扰声
    • 避免在大会议室或过于空旷的房间等地方录制。
    • 为确保数据一致性,建议在调试好录制环境后,在同一时间段内完成所有录制

    录制中

    录制事项 说明
    麦克风距离 嘴巴与麦克风保持两个拳头(10cm)左右的距离
    发音 确保发音清晰、准确
    语速 保持自然、平稳的语速,避免过快或过慢、忽快忽慢
    音量 音量应适中,避免过小或过大,或音量忽大忽小
    停顿 在标点或适当的断句处自然停顿,轻声换气
    风格 全程保持一致的风格,与实际使用场景的声音风格相符
    阅读发音 按顺序阅读,确保音字一致。避免漏字、添字、发音错误或不流畅的情况,如出现这些问题,需整句重新录制

    录制后

    • 建议使用无损音质格式保存音频文件,如 wav、m4a 格式

    声音授权

    根据相关部门的要求,所有声音克隆操作必须获得本人授权。请在完成声音采集后,额外录制一段确认音频,内容如下:我(发音人姓名)确认我的声音将会被七牛云使用于创建合成版本语音。

    数字人声音采集演讲稿

    您可自行选择自己领域熟悉的文本,我们也提供了一些文案示例:直播带货风格新闻联播风格

    以上内容是否对您有帮助?
  • Qvm free helper
    Close