开源!4个免费AI 数字人 系统源码,附下载地址
给大家分享我精心整理的4个免费开源的AI数字人系统,从声音驱动、图片数字人对口型、数字人动作模仿到数字人直播,应有尽有。(强力建议收藏,以免后续找不到了)
废话不多说,直接上干货:
01 AIGCPanel
AIGCPanel是一个简单易用的一站式AI数字人系统,小白也可上手。 支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。

软件基于 Apache-2.0 开源,永久免费,可以直接使用。
视频:视频合成、视频对口型、视频管理
声音:声音合成、声音克隆、声音管理
直播:数字人直播、语音直播、直播互动、一键使用
模型:本地模型、云端模型、模型一键启停

开源地址:https://gitee.com/modstart-lib/aigcpanel
02 Heygem
硅基智能开源数字人模型,据说是全球TOP级数字人模型、好莱坞级数字人开源平台。1秒克隆生成4K视频,支持离线8种语言。

与传统数字人训练需要数小时甚至数天的模式相比,硅基数字人克隆实现了极限压缩,仅需1秒视频或一张照片,即可完成数字人形象和声音的克隆,30秒内完成数字人克隆,60秒内合成4K超高清数字人视频,在复杂光影、侧脸、遮挡等场景下仍能保证100%口型匹配,输出多表情多肢体动作数字人视频。
开源地址:https://gitee.com/georgesu/HeyGem.ai
03 LatentSync
LatentSync是一款由字节跳动与北京交通大学联合开发的开源AI驱动视频唇形同步工具,项目不生成完整数字人,而是让声音和画面(尤其是唇形)完美匹配,是数字人技术的关键一环。

相比于通用方案,它在唇形细节的自然度和准确性上往往有更好的表现,是很多研究者和开发者用来改进自己项目的核心技术模块。
开源地址:https://github.com/bytedance/LatentSync
官网:https://www.latentsync.org/zh
04 VideoReTalking
VideoReTalking项目由西安电子科技大学、腾讯AI实验室以及清华大学共同研发,旨在通过结合视频和音频文件,创造出人物嘴型与音频完美同步的全新视频,从而提升对话的真实感和自然度。

VideoReTalking项目的魅力在于其自动化和高效性。用户无需进行复杂的操作,只需提供视频和音频文件,系统便能自动完成对口型和面部增强。
开源地址:https://github.com/OpenTalker/video-retalking
数字人项目还是比较复杂的,对系统配置要求比较高。尤其想要自己部署源码,希望这些开源宝藏,能帮你打开一扇通往AI世界深处的大门,玩出创意,玩出水平!
转自:https://mp.weixin.qq.com/s/ylYPb9qOsa7595A885hCWQ

共有 0 条评论