AI

Linly-Talker: Sistema Conversacional de Avatar Digital de Código Abierto

Linly-Talker es un sistema de avatar digital de código abierto que combina LLMs con modelos visuales para IA conversacional en tiempo real con generación de cabezas parlantes.

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
Linly-Talker: Sistema Conversacional de Avatar Digital de Código Abierto

Linly-Talker es un sistema conversacional de avatar digital de código abierto desarrollado por el equipo Kedreamix. Integra todo el pipeline de IA conversacional en un sistema único y configurable.

Repositorio: github.com/Kedreamix/Linly-Talker


Stack Tecnológico

Etapa del PipelineOpciones TecnológicasRol
Reconocimiento de Voz (ASR)Whisper, SenseVoice, FunASRConvierte voz a texto
Modelo de Lenguaje (LLM)GPT-4, Qwen, Linly, ChatGLM, DeepSeekGenera respuesta conversacional
Texto a Voz (TTS)CosyVoice, Edge-TTS, GPT-SoVITSConvierte texto a voz
Cabeza ParlanteSadTalker, Wav2Lip, MuseTalk, LivePortraitGenera video de avatar sincronizado

Generación de Cabeza Parlante

CaracterísticaSadTalkerWav2LipLivePortrait
Precisión de sincronización labialAltaMuy AltaAlta
Movimiento de cabezaNaturalMínimoExpresivo
Transferencia de expresiónModeradaNingunaFuerte
Tiempo realSí (con GPU)
Entrada de una imagen

Hardware

ComponenteMínimoRecomendado
GPUNVIDIA GTX 1660 (6GB)NVIDIA RTX 4060 / A4000
RAM16 GB32 GB
Almacenamiento20 GB libres50 GB libres

Aplicaciones

  • Quioscos de servicio al cliente
  • Tutores educativos
  • Asistentes virtuales
  • Creación de contenido
  • Herramientas de accesibilidad

FAQ

Qué es Linly-Talker? Sistema de avatar digital conversacional de código abierto que combina LLMs con modelos de generación visual.

Stack tecnológico? ASR (Whisper), LLM (GPT/Qwen/Linly), TTS (CosyVoice), cabeza parlante (SadTalker/Wav2Lip).

Clonación de voz? Sí, con 10-30 segundos de muestra de audio.

Tiempo real? Casi en tiempo real con RTX 3060+.

Licencia? MIT.

Lecturas Adicionales

TAG
CATEGORIES