Faster-Whisper: Reconocimiento de Voz 4x Más Rápido con CTranslate2
El modelo Whisper de OpenAI fue un gran avance en el reconocimiento automático de voz (ASR), demostrando que el entrenamiento supervisado a gran …
El modelo Whisper de OpenAI fue un gran avance en el reconocimiento automático de voz (ASR), demostrando que el entrenamiento supervisado a gran …
VoxCPM2 es un modelo de texto a voz (TTS) sin tokenizador desarrollado por OpenBMB, una comunidad de investigacion de IA de codigo abierto …
RVC (Conversion de Voz Basada en Recuperacion) WebUI es un marco de conversion de voz de codigo abierto desarrollado por el equipo RVC-Project …
GPT-SoVITS es un sistema de clonacion de voz y texto a voz de codigo abierto desarrollado por RVC-Boss que ha causado sensacion en la comunidad …
IndexTTS-vLLM es una versión acelerada del sistema de texto a voz IndexTTS que porta el pipeline de inferencia del modelo a vLLM. El resultado es …
La tecnologia de generacion de voz ha visto un progreso notable, pero la mayoria de los modelos open-source de texto a voz (TTS) aun luchan con …