VACE:阿里巴巴全能视频创作与编辑模型(ICCV 2025)
视频生成和编辑传统上由不同的模型处理——一个模型用于文本转视频,另一个用于视频风格化,再一个用于修补。这种碎片化使得构建全面的视频制作管线变得困难,迫使从业者学习多个模型接口。VACE(Video All-to-All Creation and Editing)通过将所有视频创作和编辑任务 …
视频生成和编辑传统上由不同的模型处理——一个模型用于文本转视频,另一个用于视频风格化,再一个用于修补。这种碎片化使得构建全面的视频制作管线变得困难,迫使从业者学习多个模型接口。VACE(Video All-to-All Creation and Editing)通过将所有视频创作和编辑任务 …
AI 音乐生成领域过去由 Suno 和 Udio 等商业服务主导,但开源生态迎来了一位强劲的挑战者。ACE-Step 1.5 是一款级联扩散变换器模型,能在 2 秒内生成完整歌曲,同时支持在消费级 GPU 上进行 LoRA 微调——这种速度、品质与可及性的组合,在开源音乐生成领域前所未见。 …
Animate Anyone 是阿里巴巴 HumanAIGC 团队的一项研究项目,能将单张照片转变为人物行走、跳舞或执行任何姿势序列的完整动画视频——同时以非凡的保真度维持角色的身份、服装和外观。它代表了使用扩散模型进行图像到视频合成最令人印象深刻的应用之一。