Parler TTS-开源高质量文本转语音 (TTS) 模型

Parler TTS是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。它是根据Dan Lyth和Simon King在Stability AI和Edinburgh University发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作进行的复现,与其他TTS模型不同,Parler-TTS是一个完全开源的发布版本,所有的数据集、预处理、训练代码和权重都以宽松的许可证公开发布

演示地址:https://huggingface.co/spaces/parler-tts/parler_tts_mini

GitHub:https://github.com/huggingface/parler-tts

圈主 管理员

热门评论
:
该帖子评论已关闭
图片审查中...
编辑答案: 我的回答: 最多上传一张图片和一个附件
x
x
购物车
优惠劵
搜索