本文将详细介绍PaddleSpeech 语音合成步骤,轻松打造个性化音频。
介绍PaddleSpeech 语音合成产品的使用:
(1)注册登录并进行实名认证。
(2)在“项目”页面中,搜索“语音合成”,选择“【有手就行】使用自己的声音做语音合成”。
(3)按照说明书进行操作,点击“运行一下”按钮。
(4)选择运行环境,需要选择32GB或以上的GPU环境。
(5)点击“运行全部Cell”图标D,安装试验所器环境。出现“运行时长:××秒结束时间:××××”字样,表示安装完成。
(6)网页应用微调训练。用鼠标双击左侧文件“untitled.streamlit.py”。在新页面中,参照网页应用引导操作。
(7)上传数据。选择格式为Wav的干声音频,保证声音平稳,且单条音频长度在2秒~10秒,超出则报错。
(8)检验并标注数据。
(9)微调模型。输入训练轮次(轮次越多,耗时越长)。当然,训练时间不是越长越好,训练时间过长可能导致过度拟合等问题。
点击“微调训练”,训练完成后,点击“导出模型”。
(10)使用合成音频,输入待转换语音的文本,选择声码器和刚训练好的模型,再制语速后,点击“合成”。
(11)下载合成好的语音到本地。
(12)由于PaddleSpeech一个收费工具,在语音合成完成后,若没有新任务,可以停项目,防止继续收费。