CosyVoice:阿里巴巴的開源多語言語音生成模型,擁有 20K 星星
語音生成技術取得了顯著進步,但大多數開源文字轉語音(TTS)模型仍在一個基本權衡中掙扎:品質與語言覆蓋率之間的取捨。由阿里巴巴 FunAudioLLM 團隊開發的 CosyVoice 打破了這個障礙,在 9 種語言與 18 種以上中文方言中提供生產級品質的語音生成。
語音生成技術取得了顯著進步,但大多數開源文字轉語音(TTS)模型仍在一個基本權衡中掙扎:品質與語言覆蓋率之間的取捨。由阿里巴巴 FunAudioLLM 團隊開發的 CosyVoice 打破了這個障礙,在 9 種語言與 18 種以上中文方言中提供生產級品質的語音生成。