克隆音色资产

克隆音色资产,支持用户上传语音进行克隆 3)我的音色

  • 进入 克隆音色资产库

  • 新增克隆音色:可从本地上传文件,或从资产库里添加(仅支持 视频/音频 类型的文件,且大小不超过10MB

    • 理想的音频时长为1-2分钟(不少于1秒),清晰且无混响、瑕疵或背景噪音

    • 音频质量是影响克隆效果最重要的因素,包括声音本身、语言、口音和录音质量

    • 保持音频一致性,确保整个过程中音调和表现保持稳定

    • 音量适中,理想范围在-23 dB至-18 dB RMS,真实峰值为-3 dB

  • 音频上传后,支持 预览试听、编辑截取时间、勾选【同时移除背景音乐】

  • 支持自定义音色名称、描述

  • 勾选《数据保护附录》后,确认【新增】,等待音色识别

  • 音色添加成功后,可点击按钮 预览试听(视频文件也只播放音频)

  • 支持对音色重命名、修改描述

  • 支持删除音色

最后更新于