语音克隆

AI May 03, 2026

VoxCPM2：OpenBMB 免分词器多语言语音合成模型

VoxCPM2 是由 OpenBMB 开发的免分词器文本转语音 (TTS) 模型；OpenBMB 是隶属于清华大学与北京人工智能研究院 (BAAI) 的开源 AI 研究社区。VoxCPM2 拥有 20 亿个参数，直接在连续语音表征上运作，跳脱传统需要离散音频分词器的框架，避免音质下降。

AI May 03, 2026

GPT-SoVITS 是由 RVC-Boss 开发的开源语音克隆与文本转语音系统，在 AI 音频社区中引起轰动。该项目的突出能力是仅需 1 分钟语音数据即可训练令人信服的语音模型的少样本语音克隆，而零样本能力只需 5-10 秒的参考音频。支持中文、英文、日文与韩文，GPT-SoVITS 结 …

AI May 03, 2026

IndexTTS-vLLM 是 IndexTTS 文本转语音系统的加速版本，将模型的推理流水线移植到 vLLM 上运行——vLLM 是原本为大型语言模型服务开发的高性能推理引擎。结果是 TTS 推理速度提升 2.5-3.5 倍，在消费级 GPU 上实现了具有零样本语音克隆和多角色音频混合的 …