Parler-TTS :一个完全开源的的高质量TTS模型

Parler-TTS 是一个由 Hugging Face 开发的轻量级文本转语音(TTS)模型,能够以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现,两位作者分别来自 Stability AI 和爱丁堡大学。

与其他TTS模型不同,Parler-TTS 完全开源发布,包括数据集、预处理、训练代码和权重。

GitHub:https://github.com/huggingface/parler-tts

模型下载:https://huggingface.co/parler-tts

在线体验:https://huggingface.co/spaces/parler-tts/parler_tts_mini

退出移动版