LTX-2:Lightricks 开源 4K 音频-视频基础模型
LTX-2 是首个开源基于 Diffusion Transformer(DiT)的音频-视频基础模型,能够以高达每秒 50 帧的速度生成同步的 4K 音频-视频内容。 仓库:github.com/Lightricks/LTX-2 架构 功能 LTX-2 (DiT) 传统 U-Net 模型 …
LTX-2 是首个开源基于 Diffusion Transformer(DiT)的音频-视频基础模型,能够以高达每秒 50 帧的速度生成同步的 4K 音频-视频内容。 仓库:github.com/Lightricks/LTX-2 架构 功能 LTX-2 (DiT) 传统 U-Net 模型 …