Audio

AI May 04, 2026

Faster-Whisper: Reconocimiento de Voz 4x Más Rápido con CTranslate2

El modelo Whisper de OpenAI fue un gran avance en el reconocimiento automático de voz (ASR), demostrando que el entrenamiento supervisado a gran …

IA May 03, 2026

VoxCPM2 es un modelo de texto a voz (TTS) sin tokenizador desarrollado por OpenBMB, una comunidad de investigacion de IA de codigo abierto …

IA May 03, 2026

RVC (Conversion de Voz Basada en Recuperacion) WebUI es un marco de conversion de voz de codigo abierto desarrollado por el equipo RVC-Project …

IA May 03, 2026

GPT-SoVITS es un sistema de clonacion de voz y texto a voz de codigo abierto desarrollado por RVC-Boss que ha causado sensacion en la comunidad …

AI May 03, 2026

IndexTTS-vLLM es una versión acelerada del sistema de texto a voz IndexTTS que porta el pipeline de inferencia del modelo a vLLM. El resultado es …

AI May 02, 2026

La tecnologia de generacion de voz ha visto un progreso notable, pero la mayoria de los modelos open-source de texto a voz (TTS) aun luchan con …