VoiceCraft是由德州大学奥斯汀分校和Rembrand的研究团队开发的高级语音技术。它主要做两件事:一是编辑现有的语音录音,二是将文本转换成语音(也就是文字到语音转换,简称TTS),并且这些都可以在没有事先大量学习特定人声的情况下完成。
VoiceCraft在语音编辑方面能够使编辑后的语音几乎听不出和原始录音的区别。在无样本文本到语音转换(即在没有大量特定人声学习样本的情况下进行文字到语音的转换)方面,它的性能超过了当前最好的模型,包括VALLE和XTTS v2这样的商业模型。
VoiceCraft是由德州大学奥斯汀分校和Rembrand的研究团队开发的高级语音技术。它主要做两件事:一是编辑现有的语音录音,二是将文本转换成语音(也就是文字到语音转换,简称TTS),并且这些都可以在没有事先大量学习特定人声的情况下完成。
VoiceCraft在语音编辑方面能够使编辑后的语音几乎听不出和原始录音的区别。在无样本文本到语音转换(即在没有大量特定人声学习样本的情况下进行文字到语音的转换)方面,它的性能超过了当前最好的模型,包括VALLE和XTTS v2这样的商业模型。