本文将详细介绍PaddleSpeech 语音合成步骤,轻松打造个性化音频。

介绍PaddleSpeech 语音合成产品的使用:

(1)注册登录并进行实名认证。

(2)在“项目”页面中,搜索“语音合成”,选择“【有手就行】使用自己的声音做语音合成”。

(3)按照说明书进行操作,点击“运行一下”按钮。

(4)选择运行环境,需要选择32GB或以上的GPU环境。

PaddleSpeech 语音合成

(5)点击“运行全部Cell”图标D,安装试验所器环境。出现“运行时长:××秒结束时间:××××”字样,表示安装完成。

(6)网页应用微调训练。用鼠标双击左侧文件“untitled.streamlit.py”。在新页面中,参照网页应用引导操作。

(7)上传数据。选择格式为Wav的干声音频,保证声音平稳,且单条音频长度在2秒~10秒,超出则报错。

(8)检验并标注数据。

(9)微调模型。输入训练轮次(轮次越多,耗时越长)。当然,训练时间不是越长越好,训练时间过长可能导致过度拟合等问题。

点击“微调训练”,训练完成后,点击“导出模型”。

(10)使用合成音频,输入待转换语音的文本,选择声码器和刚训练好的模型,再制语速后,点击“合成”。

(11)下载合成好的语音到本地。

(12)由于PaddleSpeech一个收费工具,在语音合成完成后,若没有新任务,可以停项目,防止继续收费。

(本文内容根据网络资料整理,出于传递更多信息之目的,不代表连连国际赞同其观点和立场)
*连连国际 (LianLian Global) 是连连数字旗下跨境支付核心品牌