VoiceCraft：无样本文本到语音转换和语音编辑模型

VoiceCraft是由德州大学奥斯汀分校和Rembrand的研究团队开发的高级语音技术。它主要做两件事：一是编辑现有的语音录音，二是将文本转换成语音（也就是文字到语音转换，简称TTS），并且这些都可以在没有事先大量学习特定人声的情况下完成。

VoiceCraft在语音编辑方面能够使编辑后的语音几乎听不出和原始录音的区别。在无样本文本到语音转换（即在没有大量特定人声学习样本的情况下进行文字到语音的转换）方面，它的性能超过了当前最好的模型，包括VALLE和XTTS v2这样的商业模型。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。

开通会员