扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)

前言

前一段时间,我在搞数字人方面的,想用coze做一个工作流来自动生成数字人口播视频
尝试了coze里面的婵镜和飞影数字人插件,发现用这样的插件做出来的效果和直接用他们官网进行制作并没有什么特别的优势,我甚至感觉还不如直接在他们官网上使用呢
所以我就抛弃了上面的这两个方式,搭建出了一个成本更低、操作更傻瓜、效果还不错的生成数字人的工作流
实现了一键制作出数字人,即用即走!

这个工具是不是制作数字人更加方便,而且效果还是在线的,如果你也感兴趣,请继续往下看吧。
接下来,我们和大家分享如何制作出这个的数字人的工作流,大家可以关注点赞收藏,后续我会继续为大家分享工作流教程。

正文

一、整体工作流如下:

二、开发思路:

从上传的口播文件中提取出音频的内容
再通过音色复刻,将输入的文案结合音频进行声音克隆
将克隆出来的声音加上口播视频进行制作出数字人
最后在视频上加上字幕

三、详细工作流分析
1、开始节点

接收应用UI传进来的口播文件和口播文案

2、音频文件提取

接收“开始节点”的口播文件,将音频提取出来
注:自制插件

3、音频内容提取

将口播文件的音频内容提取出来

4、声音克隆

结合口播的音频和“开始节点”的文案进行音色复刻,并完成声音的克隆
注:自制插件

5、数字人生成

传入“开始节点”的口播文件以及克隆出来的音频进行数字人生成

6、查询数字人

我们在这个循环体里面间隔的查询数字人是否已经生成

7、生成字幕

将生成的数字人链接传入进来生成下方带有字幕的数字人


到此为止,整个数字人的制作完成了,用这个工作流制作数字人是不是很方便的呢?
掌握以上关键步骤, 你也能轻松制作出自己的数字人! 快去亲自试试吧!

关键点分析

视频中展示的登录页面,我虽然没有讲,但是也是一个比较重要的地方,这个登录界面是不依赖于任何第三方的接口,纯coze就可以实现,对于想做付费的小伙伴,是一个比较不错的方案
声音克隆:采用的是通义千问的CosyVoice2.0,克隆出来的声音虽然达不到原声的程度,但是整体效果还是不错的
数字人:采用的是当下比较火的开源数字人平台heygem,对出来的口型也是非常不错

总结

我起初搭建这个数字人工具的时候,奔着两个目的来的:一是想操作方便,即傻瓜式操作,不需要任何的认证、预训练等环节,即用即走。
另外一个是要比婵镜和飞影等数字人平台的制作成本更加低廉。
再者就是这个数字人可以部署在飞书上面,用手机操作就能生成口播数字人,人在外面,也能随时随地生成口播数字人视频。

转自:https://mp.weixin.qq.com/s/m3Opm8CHI96LnDL0vXFbXw

文章版权归原作者所有或来自互联网,未经允许请勿转载。如有侵权请联系我删除,谢谢!
THE END
分享
二维码
打赏
< <上一篇
下一篇>>
文章目录
关闭
目 录