最近Chat-TTS模型很火,生成的语音以假乱真,几乎听不出AI的味道。我自己在本地部署玩了一下,记录一下其中遇到的问题。
环境:
系统:windows 11
GPU: Nvidia 4060
Cuda:12.1(建议安装12.1版本,最新的12.4需要自己编译pyotrch包)
cudnn: 9.2
注意:在windows x86平台上建议使用conda虚拟环境来管理python包,很重要的一点是项目依赖的pynini
不能在windows x86平台上编译安装,但是可以通过conda提供的二进制包来安装,省去了很多麻烦。
下载文件:
-
下载项目代码:
git clone https://github/2noise/ChatTTS.git
-
下载模型权重文件,我使用的是阿里的modelscope,国内下载比较快。 https://modelscope/models/pzc163/chatTTS/summary
(有条件可以连接huggingface的,也可以不用自己提前下载,直接运行代码等待自动下载。)
使用modelscope,可以手动在页面下载,或者通过其提供的SDK下载,使用SDK下载会将模型保存在C:\Users\<你的用户名>\.cache\modelscope
最近Chat-TTS模型很火,生成的语音以假乱真,几乎听不出AI的味道。我自己在本地部署玩了一下,记录一下其中遇到的问题。
环境:
系统:windows 11
GPU: Nvidia 4060
Cuda:12.1(建议安装12.1版本,最新的12.4需要自己编译pyotrch包)
cudnn: 9.2
注意:在windows x86平台上建议使用conda虚拟环境来管理python包,很重要的一点是项目依赖的pynini
不能在windows x86平台上编译安装,但是可以通过conda提供的二进制包来安装,省去了很多麻烦。
下载文件:
-
下载项目代码:
git clone https://github/2noise/ChatTTS.git
-
下载模型权重文件,我使用的是阿里的modelscope,国内下载比较快。 https://modelscope/models/pzc163/chatTTS/summary
(有条件可以连接huggingface的,也可以不用自己提前下载,直接运行代码等待自动下载。)
使用modelscope,可以手动在页面下载,或者通过其提供的SDK下载,使用SDK下载会将模型保存在C:\Users\<你的用户名>\.cache\modelscope