Fish Speech：完美支持中英日语言的开源TTS模型接近人类水平

Fish Speech 是一个全新的文本转语音 (TTS) 解决方案，该项目由fishaudio开发。当前模型使用约十五万小时三语数据训练，对中文支持非常的完美。

能够熟练处理和生成中文、日语和英语的语音，语言处理能力接近人类水平，并且声音表现形式丰富多变。作为一个仅有亿级参数的模型，Fish Speech 设计高效轻量，用户可以在个人设备上轻松运行和微调，成为您的私人语音助手。

设计高效轻量，用户可以在个人设备上轻松运行和调整模型性能。

Fish Speech 支持多种不同的语音生成模型，包括但不限于：

VITS2：一种基于变分推理的文本到语音模型。
Bert-VITS2：结合BERT模型的变分推理文本到语音模型。
GPT VITS：结合GPT模型的文本到语音模型。
MQTTS：基于量化技术的文本到语音模型。
GPT Fast：快速生成语音的GPT模型。
GPT-SoVITS：结合GPT和SoVITS技术的文本到语音模型。

Fish Speech 提供了一个在线演示�

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。

开通会员

Menu

分类目录

Fish Speech：完美支持中英日语言的开源TTS模型接近人类水平

Related Posts

ElevenLabs 推出对话式AI工具可在几分钟内为网站、应用或电话中心创建语音代理

Luma 推出 Luma Photon 和 Photon Flash 基于全新架构的图像生成模型

Hume AI 推出 Voice Control 功能通过滑块操作即可实现个性化的语音定制

不同文本转语音（TTS）模型对比优缺点以及场景选择

IC-Light 升级为IC-Light V2-Vary 可更灵活地调整光源位置和强度

微软发布 Co-op Translator 可以一次性将Markdown 文件和和图像翻译成多种语言

Recommendeds

MoneyPrinterTurbo：利用大语言模型一键生成1分钟长的短视频

Google DeepMind全新机器人框架使机器人能进行一对一的足球比赛

OpenReplay：像看电影一样回看用户如何与你的产品互动

英国作家协会调查显示，1/3的翻译者和1/4的插画师已经因AI失去了工作

AI21 推出Jamba-Instruct 模型 256K上下文窗口专为商业用途设计

如何使用Midjourney v6 创建自己的服装品牌

GameNGen：一个完全由神经模型驱动的游戏引擎根据玩家操作实时生成游戏画面

MeloTTS：支持中英混合发音的多语言文本到语音（TTS）库

PaintsUndo：输入静态图像自动帮你生成整个绘画的全过程视频

BinaryVectorDB：二进制向量数据库速度提高20倍成本降低100倍

Welcome Back!

Retrieve your password

Add New Playlist

Are you sure want to unlock this post?

Are you sure want to cancel subscription?

Menu

分类目录

Fish Speech：完美支持中英日语言的开源TTS模型 接近人类水平

Support authors and subscribe to content

加入会员

Related Posts

Recommendeds

Welcome Back!

Retrieve your password

Add New Playlist

Are you sure want to unlock this post?

Are you sure want to cancel subscription?

Fish Speech：完美支持中英日语言的开源TTS模型接近人类水平