VALL-E X｜多语言文本到语音合成与语音克隆

2023-10-10 21:56:25

微软VALL-E X 零样本语音合成模型的开源实现
预训练模型现已向公众开放，供研究或应用使用

VALL-E X 是一个强大而创新的多语言文本转语音（TTS）模型，最初由微软发布。虽然微软最初在他们的研究论文中提出了该概念，但并未发布任何代码或预训练模型。我们认识到了这项技术的潜力和价值，复现并训练了一个开源可用的VALL-E X模型。

VALL-E X 配备有一系列尖端功能：

多语言 TTS: 可使用三种语言 – 英语、中文和日语 – 进行自然、富有表现力的语音合成。

零样本语音克隆: 仅需录制任意说话人的短短的 3~10 秒录音，VALL-E X 就能生成个性化、高质量的语音，完美还原他们的声音。

GitHub：https://github.com/Plachtaa/VALL-E-X

演示页面：https://plachtaa.github.io/

圈主管理员

热门评论

该帖子评论已关闭

图片审查中...

编辑答案：我的回答：最多上传一张图片和一个附件

表情

图片

附件

取消编辑

❯

购物车

优惠劵

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

查看所有

我的优惠劵

没有优惠劵可用!

购物车

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部

{{userData.name}}已认证