IndexTTS-vLLM: Texto a Voz Acelerado de Código Abierto con Inferencia vLLM
IndexTTS-vLLM es una versión acelerada del sistema de texto a voz IndexTTS que porta el pipeline de inferencia del modelo a vLLM. El resultado es …
IndexTTS-vLLM es una versión acelerada del sistema de texto a voz IndexTTS que porta el pipeline de inferencia del modelo a vLLM. El resultado es …
StoryDiffusion es un proyecto de investigación de la Universidad de Nankai y ByteDance que aborda uno de los problemas más difíciles en IA …
Nexus Skills es una herramienta de código abierto que resuelve uno de los problemas más costosos en el desarrollo asistido por IA: el contexto …
LLaMA-VID es un proyecto de investigación de ECCV 2024 que aborda el cuello de botella fundamental en la comprensión de video con LLMs: la …
LightRAG es un proyecto de investigación de la Universidad de Hong Kong (HKU) que reinventa la generación aumentada por recuperación (RAG) …
Animate Anyone es un proyecto de investigación del grupo HumanAIGC de Alibaba que convierte una sola foto en un video completamente animado de …