10款优秀的开源TTS语音模型推荐-AI万花筒

10款优秀的开源TTS语音模型推荐.jpg

在平时的语音合成TTS整理中，目前有许多优秀的文本转语音（TTS）模型可以推荐，以下是我整理的一些在研究和实际应用中表现突出的10款优秀TTS语音模型：

1、GPT-SoVITS

ai 卖货主播大模型Streamer-Sales销冠用的这款TTS模型，支持英语、日语和中文，零样本文本到语音（TTS）。

集成工具包：github：https://github.com/RVC-Boss/GPT-SoVITS

2、Fish Speech v1.2

效果稳定非常好，支持克隆语音。经过 30 万小时的英语、中文和日语音频数据的训练。

模型：https://huggingface.co/fishaudio/fish-speech-1.2

在线版：https://fish.audio/zh-CN/

3、字节的Seed-TTS（不开源）

支持多种语言包括英语、中文，能够进行同语言生成和跨语言生成，能处理各种文本，叙述性文本、情感表达、描述性文本等，能根据不同的情感和语境生成相应的语音。

项目：https://bytedancespeech.github.io/seedtts_tech_report/

4、ChatTTS

对话式 TTS（可多人），支持中英文，韵律细腻。

github：https://github.com/2noise/ChatTTS

模型：https://huggingface.co/2Noise/ChatTTS/tree/main

5、Parler-TTS

可以控制音调、速度、性别、噪音水平、情绪特征等等

github：https://github.com/huggingface/parler-tts

模型：https://huggingface.co/parler-tts

6、MetaVoice-1B

支持多语言，在英语处理上实现了情感语音节奏

github：https://github.com/metavoiceio/metavoice-src

7、MARS5-TTS

MARS5可以为体育解说、动漫等韵律复杂和多样化的场景生成语音

github：https://github.com/Camb-ai/MARS5-TTS

8、OpenVoice

原生支持英语、西班牙语、法语、中文、日语和韩语，具有灵活的语音风格控制和零样本跨语言语音克隆能力。

github：https://github.com/myshell-ai/OpenVoice

9、EmotiVoice

支持中英文双语，包含2000多种不同的音色

github：https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md

10、StyleTTS2

近乎人类水平的文本转语音库，它利用风格扩散和对抗训练与大型语音语言模型（SLM）来实现人类水平的 TTS 合成。

github：https://github.com/yl4579/StyleTTS2

以上是我整理的10款优秀TTS语音模型，这些模型在不同的应用场景和硬件配置下各有优劣，选择合适的模型需要根据具体应用和资源进行评估。