开源配音神器VoiceCraft,免费无限用还能本地部署
- 免费干货
- 3小时前
- 6热度
- 0评论
今天聊个好东西——VoiceCraft,一个开源语音处理平台。GitHub上8K+ Star,代码全部公开,支持本地部署。处理速度也离谱,每50字的语音编辑大约只要15秒,长篇内容几分钟就搞定。

VoiceCraft由德克萨斯大学奥斯汀分校、Meta FAIR、Rembrand等团队联合推出。性能直接碾压VALL-E和XTTS-v2,主要就干两件事:文字转语音、语音转文字。
凭啥值得关注?
- 永久免费:不限次数,一分钱不用花,无限肝
- 不用登录:打开网页直接开玩,不搞那些花花绕
- 可私有化部署:源码全开源,自己服务器上跑一套,数据全在你自己手里,安全感拉满
不用注册、不用绑手机号、不用关注公众号领次数。说实话,这种产品现在真不多了,你说是不是?

部署方式有好几种,最推荐Docker一键部署,省心到爆。
最后说两句
VoiceCraft的能力远不止配音和转文字。如果你想自己搭个配音平台,这个项目值得深挖。更多玩法去GitHub看源码吧。
GitHub开源:https://github.com/jasonppy/VoiceCraft
VoiceCraft支持中文配音吗?
支持。VoiceCraft对中英文都有较好的语音合成效果,中文自然度在开源模型里属于第一梯队。我倒是认为日常使用完全够了。
本地部署需要什么配置?
建议至少8GB显存的GPU,内存16GB以上。CPU也能跑,但速度会慢不少,这真的有用吗?看你需求吧,不是实时场景的话CPU凑合也行。
VoiceCraft和VALL-E哪个好?
根据公开评测,VoiceCraft在语音克隆的自然度和编辑灵活性上优于VALL-E,而且完全开源免费,商用也没有障碍。老实讲,就冲免费+开源这一点,已经赢麻了。