AI

edge-tts:使用 Microsoft Edge 在线服务的 Python TTS

edge-tts 是一个 Python CLI 工具,使用 Microsoft Edge 的在线 TTS 服务从文本生成语音,支持数百种声音和语言。

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
edge-tts:使用 Microsoft Edge 在线服务的 Python TTS

高质量的文本转语音通常需要昂贵的云端 API 或复杂的本地模型设置。由 rany2 创建的 Edge-TTS 采取了一个巧妙的方法:它接入 Microsoft Edge 内建的在线 TTS 服务,提供对数百种自然声音的免费访问,涵盖数十种语言。

该工具是一个简单的 Python CLI,可将文字转换为音频文件,使用与 Microsoft Edge 浏览器朗读功能相同的神经 TTS 声音。支持 SSML、语音调整和字幕生成,使其作为免费的开源 TTS 解决方案远远超出其预期功能。

语音和语言支持

语言男声女声质量
英文(美国)810神经网络高质量
英文(英国)56神经网络高质量
中文(普通话)45神经网络高质量
日文34神经网络高质量
西班牙文45神经网络高质量
法文34神经网络高质量
德文34神经网络高质量
总计 60+ 种语言100+200+神经网络

音频生成管线

管线同时处理纯文本和 SSML 输入。SSML 允许对发音、音高、语速和强调进行精细控制。来自 Edge API 的音频流存储为 MP3 或 WAV,并且可以生成具有逐字时间戳的字幕。

功能比较

功能edge-ttsGoogle TTSAWS PollyElevenLabs
成本免费免费额度有限按用量付费按用量付费
语音数量300+100+50+100+
SSML 支持部分
字幕导出
需要 API 密钥

实际应用

Edge-TTS 非常适合生成配音的内容创作者、原型制作语音功能的开发者、需要屏幕阅读器声音的无障碍工具、语言学习应用和 Podcast 创作。无需 API 密钥或使用限制使其对于具有不可预测流量或预算限制的项目特别有吸引力。

如需更多信息,请访问 edge-tts GitHub 仓库Microsoft Edge TTS 语音列表

常见问题

Q:使用 edge-tts 合法吗? A:是的,它使用与 Microsoft Edge 浏览器功能相同的公开 API。商业使用请查阅 Microsoft 的使用条款。

Q:它需要网络连接吗? A:是的,TTS 处理通过 Edge API 在 Microsoft 的服务器上进行。

Q:我可以调整语音速度和音高吗? A:可以,通过 SSML 标签对韵律进行精细控制。

Q:它输出哪些音频格式? A:开箱即用支持 MP3 和 WAV。

Q:生成的音频可以多长? A:没有硬性限制,但为了可靠性,很长的文字应该分段处理。

TAG
CATEGORIES