声音大模型之音色克隆 本文介绍了声音大模型领域的两个分支:SVC(音色转换)和TTS(文字转语音)。SVC主要关注音色特点的复刻,而TTS更偏向于学习原语音发音特点进行模仿。当前两个开源项目分别是SoftVC VITS歌声转换和阿里开源的TTS项目CosyVoice。前者可以模仿原声音的特点生成歌声,但在自然语音生成上存 4月前 达达下雨不吃鱼 Technical 0