OpenAI发布其语音生成模型:Voice Engine 15秒克隆你的声音

OpenA分享了关于Voice Engine的初步见解和结果,这是一个可以根据文本输入和一个15秒的音频样本生成接近原始说话者声音的自然听起来的语音的模型。通过这个小规模的预览,OpenAI表明即便是一个小型模型和一个15秒的样本也能创造出具有情感和真实感的声音。

主要功能

  1. 自然听起来的语音生成:利用单个15秒的音频样本,Voice Engine能够创造出既情感丰富又真实的语音,显著提升合成语音的自然度和真实感。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
退出移动版