CosyVoice:阿里巴巴的开源多语言语音生成模型,拥有 20K 星标
语音生成技术取得了显著进步,但大多数开源文本转语音(TTS)模型仍在一个基本权衡中挣扎:质量与语言覆盖率之间的取舍。由阿里巴巴 FunAudioLLM 团队开发的 CosyVoice 打破了这一障碍,在 9 种语言与 18 种以上中文方言中提供生产级质量的语音生成。
语音生成技术取得了显著进步,但大多数开源文本转语音(TTS)模型仍在一个基本权衡中挣扎:质量与语言覆盖率之间的取舍。由阿里巴巴 FunAudioLLM 团队开发的 CosyVoice 打破了这一障碍,在 9 种语言与 18 种以上中文方言中提供生产级质量的语音生成。