Hume AI 推出 Voice Control 功能 通过滑块操作即可实现个性化的语音定制

Hume AI 推出了名为 Voice Control 的新技术,这是基于可解释性的AI语音定制方法,无需语言描述,仅通过滑块操作即可实现个性化的语音定制。帮助开发者精准调整AI语音的个性化特征,同时避免语音克隆的潜在风险。

它可以让你像调音台一样调整AI生成的声音,让它更符合你的需求。你可以改变声音的性别感、自信度、热情、柔和程度等等,一共10个不同的维度。比如,你想让声音听起来更自信、更放松,或者更热情,都可以用简单的滑块调整。


技术特点

  1. 语音属性控制
    Voice Control 提供了10个可调语音维度,包括:
    • 性别感(Masculine/Feminine):声音的性别倾向,从更阳刚到更柔和。
    • 自信度(Confidence):声音的笃定程度,从害羞到自信。
    • 热情度(Enthusiasm):声音的情绪活跃度,从平静到热情。
    • 放松度(Relaxedness):声音的紧张感,从紧绷到放松。
    • 平滑度(Smoothness):声音的质感,从断续到流畅。 其他维度还包括声音的鼻音度、活力、紧致度等。
  2. 精确可控
    • 提供从-100到100的连续调节范围,用户可以根据需要细致调整声音特性。
    • 调整后的语音属性在不同会话中一致可复现。
  3. 避免语音克隆风险
    • 不直接复制真人语音,而是通过语音模型生成独特语音,降低隐私和安全风险。
  4. 操作简便
    • 无代码界面:用户可以直接通过滑块实时预览和调整语音效果。
    • 实时生成:快速生成符合需求的语音,适用于实时应用。

应用场景


技术实现与整合

  1. 创建过程
    • 选择基础语音模型。
    • 使用滑块调整10个语音属性。
    • 实时预览修改效果。
    • 部署到Empathic Voice Interface (EVI)平台。
  2. 技术优势
    • 语音调整独立性强,各特性之间互不干扰。
    • 修改后的语音在不同设备和场景中表现稳定。

未来展望

原文:https://www.hume.ai/blog/introducing-voice-control

退出移动版