克隆音色资产
最后更新于
最后更新于
克隆音色资产,支持用户上传语音进行克隆
进入 克隆音色资产库
新增克隆音色:可从本地上传文件,或从资产库里添加(仅支持 视频/音频 类型的文件,且大小不超过10MB)
理想的音频时长为1-2分钟(不少于1秒),清晰且无混响、瑕疵或背景噪音
音频质量是影响克隆效果最重要的因素,包括声音本身、语言、口音和录音质量
保持音频一致性,确保整个过程中音调和表现保持稳定
音量适中,理想范围在-23 dB至-18 dB RMS,真实峰值为-3 dB
音频上传后,支持 预览试听、编辑截取时间、勾选【同时移除背景音乐】
支持自定义音色名称、描述
勾选《数据保护附录》后,确认【新增】,等待音色识别
音色添加成功后,可点击按钮 预览试听(视频文件也只播放音频)
支持对音色重命名、修改描述
支持删除音色