AI

edge-tts: TTS en Python Usando el Servicio Online de Microsoft Edge

edge-tts es una herramienta CLI de Python para generar voz a partir de texto usando el servicio TTS online de Microsoft Edge, compatible con cientos de voces e idiomas.

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
edge-tts: TTS en Python Usando el Servicio Online de Microsoft Edge

La conversión de texto a voz de alta calidad generalmente requiere costosas APIs en la nube o complejas configuraciones de modelos locales. Edge-TTS, creado por rany2, adopta un enfoque ingenioso: aprovecha el servicio TTS en línea integrado en Microsoft Edge, proporcionando acceso gratuito a cientos de voces naturales en docenas de idiomas.

La herramienta es un simple CLI de Python que convierte texto a archivos de audio usando las mismas voces de TTS neuronal que alimentan la función de lectura en voz alta del navegador Microsoft Edge. Soporta SSML, ajuste de voz y generación de subtítulos, lo que la hace mucho más potente de lo que su simple propósito sugiere, como solución gratuita y de código abierto.

Soporte de Voces e Idiomas

IdiomaVoces MasculinasVoces FemeninasCalidad
Inglés (EE.UU.)810Neural de alta calidad
Inglés (Reino Unido)56Neural de alta calidad
Chino (Mandarín)45Neural de alta calidad
Japonés34Neural de alta calidad
Español45Neural de alta calidad
Francés34Neural de alta calidad
Alemán34Neural de alta calidad
Total 60+ idiomas100+200+Neural

Pipeline de Generación de Audio

El pipeline maneja tanto entrada de texto plano como SSML. SSML permite control fino sobre pronunciación, tono, velocidad y énfasis. El flujo de audio de la API de Edge se guarda como MP3 o WAV, y se pueden generar subtítulos con marcas de tiempo palabra por palabra.

Comparación de Funcionalidades

Característicaedge-ttsGoogle TTSAWS PollyElevenLabs
CostoGratuitoCrédito gratuito limitadoPago por usoPago por uso
Número de voces300+100+50+100+
Soporte SSMLParcial
Exportación de subtítulosNoNoNo
Requiere clave APINo

Casos de Uso

Edge-TTS es excelente para creadores de contenido que generan narraciones, desarrolladores que prototipan funciones de voz, herramientas de accesibilidad que necesitan voces de lectores de pantalla, aplicaciones de aprendizaje de idiomas y creación de podcasts. Sin necesidad de clave API ni límites de uso, es particularmente atractivo para proyectos con tráfico impredecible o restricciones de presupuesto.

Para más información, visita el repositorio de GitHub de edge-tts y la lista de voces TTS de Microsoft Edge.

Preguntas Frecuentes

Q: ¿Es legal usar edge-tts? A: Sí, utiliza la misma API pública que usa la función del navegador Microsoft Edge. Para uso comercial, consulta los términos de Microsoft.

Q: ¿Requiere conexión a internet? A: Sí, el procesamiento TTS se realiza en los servidores de Microsoft a través de la API de Edge.

Q: ¿Puedo ajustar la velocidad y el tono de la voz? A: Sí, a través de etiquetas SSML para control fino de la prosodia.

Q: ¿Qué formatos de audio produce? A: MP3 y WAV listos para usar.

Q: ¿Qué tan largo puede ser el audio generado? A: Sin límite estricto, pero los textos muy largos deben procesarse en segmentos para mayor confiabilidad.

TAG
CATEGORIES