以商业产品万兴播爆的数字人短视频与硅基智能的硅语系统作为示例,进行相关的演示。
1)万兴播爆的数字人短视频
万兴播爆是上市公司万兴旗下的短视频创作应用产品。作者下载的是 Windows 桌面端产品V1.0.3版。
万兴播爆产品的功能主要由首页的数字人列表和第二页的视频模板构成,提供了大量的数字人模型和场景模板。其主要流程是,利用其短视频编辑工具和素材模板或自导入的图片/视频片段制作视频画面,使用文本转语音功能生成语音,利用语音驱动数字人唇形运动,从而达到虚拟主播在设置的场景中进行口播的目的。
采用其业务模板,制作一个短视频,流程如下。
第一步,选取一个数字人模型,进入短视频编辑页面。
第二步,在画面中添加背景、文字和贴图,也可以导入图片到画中画中,用作背景。
第三步,导入语音的文字脚本,选择语言对应的TTS模型,生成语音,并添加背景音乐。
第四步,预览,测试文字转语音的效果,数字人唇形和画面不支持预览。
第五步,导出后等待合成,然后下载到本地。
在体验中发现,万兴播爆提供的数字人通过语音驱动唇形效果挺不错,在生成的视频中,数字人口播看起来与真人无异,数字人动作是预录的,在短视频中看不出差异,视频稍长,就会发现动作重复,因而较适合制作短视频。利用其文字转语音功能,转出的语音字正腔圆,缺少一定的感情色彩。不过,由于万兴播爆集成了很多国家的语言,使得该产品尤其适合跨境出海应用。所以,将其丰富的场景模板和多语言功能相结合,比较适合在多种场景下制作传统广告视频素材和较为严肃的口播视频。