Tags

擴散模型

VACE:阿里巴巴全能影片創作與編輯模型(ICCV 2025)
AI

VACE:阿里巴巴全能影片創作與編輯模型(ICCV 2025)

影片生成和編輯傳統上由不同的模型處理——一個模型用於文字轉影片,另一個用於影片風格化,再一個用於修補。這種碎片化使得建立全面的影片製作管線變得困難,迫使從業者學習多個模型介面。VACE(Video All-to-All Creation and Editing)透過將所有影片創作和編輯任務 …

ACE-Step 1.5:開源音樂生成模型超越商業方案
AI

ACE-Step 1.5:開源音樂生成模型超越商業方案

AI 音樂生成領域過去由 Suno 和 Udio 等商業服務主導,但開源生態系迎來了一位強勁的挑戰者。ACE-Step 1.5 是一款串聯擴散轉換器模型,能在 2 秒內生成完整歌曲,同時支援在消費級 GPU 上進行 LoRA 微調——這種速度、品質與可及性的組合,在開源音樂生成領域前所未見 …

Animate Anyone:從單張圖片實現 AI 驅動的角色動畫
AI

Animate Anyone:從單張圖片實現 AI 驅動的角色動畫

Animate Anyone 是阿里巴巴 HumanAIGC 團隊的一項研究專案,能將單張照片轉變為人物行走、跳舞或執行任何姿勢序列的完整動畫影片——同時以非凡的保真度維持角色的身份、服裝和外觀。它代表了使用擴散模型進行影像到影片合成最令人印象深刻的應用之一。

TAG