Deepgram Aura:低于250毫秒的 实时文本转语音API 可以实时互动

Deepgram 推出了名为 Aura 的全新文本转语音(TTS)API,这是为实时对话 AI 代理和应用程序设计的首款文本转语音模型。Aura 包含十几种自然、类人的声音,其延迟低于任何可比较的语音 AI 替代品,并已经在几个客户的生产环境中得到使用。

Aura 为 AI 代理配备逼真的声音,并已开发出能够复制真实人类对话的能力。这包括迅速回复、自然的节奏(包括停顿、可听到的呼吸和犹豫声音如“呃”和“嗯”)以及根据对话内容调整音调和情感的动态调整。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
退出移动版