VACE:阿里巴巴全能影片創作與編輯模型(ICCV 2025)
影片生成和編輯傳統上由不同的模型處理——一個模型用於文字轉影片,另一個用於影片風格化,再一個用於修補。這種碎片化使得建立全面的影片製作管線變得困難,迫使從業者學習多個模型介面。VACE(Video All-to-All Creation and Editing)透過將所有影片創作和編輯任務 …
影片生成和編輯傳統上由不同的模型處理——一個模型用於文字轉影片,另一個用於影片風格化,再一個用於修補。這種碎片化使得建立全面的影片製作管線變得困難,迫使從業者學習多個模型介面。VACE(Video All-to-All Creation and Editing)透過將所有影片創作和編輯任務 …
在行動和邊緣裝置上執行深度學習模型面臨獨特挑戰:有限的運算能力、受限的記憶體、電池敏感度以及多樣的硬體架構。MNN(Mobile Neural Network)是阿里巴巴對這些挑戰的回應,這是一款輕量級推論引擎,以最小的開銷和最大的效能將 AI 帶到邊緣。
隨著 AI 應用從原型走向生產,管理 LLM API 流量的基礎設施層變得至關重要。組織需要將請求路由到正確的模型、以 Token 級別的速率限制控制成本、智慧地快取回應,以及跨團隊和應用監控使用情況。Higress 作為一個基於經過實戰考驗的 Istio 和 Envoy 基礎建置的雲原生 …
建立生產級的多代理系統以複雜著稱。協調代理之間的通訊、管理分散式部署、與外部工具整合以及確保可觀察性,是大多數框架只能部分解決的挑戰。AgentScope 由阿里巴巴通義實驗室開發,以一個專為真實世界、可擴展的多代理應用設計的綜合框架來應對這些挑戰。
Qwen2.5-Omni 是阿里巴巴的旗艦開源多模態 AI 模型,由阿里雲的 QwenLM 團隊開發。作為一個統一的端到端模型,Qwen2.5-Omni 可以同時感知與理解文字、圖像、音訊與影片輸入,同時產生串流文字與自然語音輸出——全部在單一架構內完成。
Qwen Code 是由阿里雲 QwenLM 團隊開發的開源 AI 驅動終端機代理。Qwen Code 從頭開始為終端機環境打造,提供 Claude Code 風格的互動式編碼體驗,專為阿里巴巴的 Qwen 模型系列最佳化,同時透過多協定提供者系統保持與 …