Post

部落格

SoloSoft 關於軟體工程、Hugo、網站效能與多語系內容發佈的技術文章。

Animate Anyone:從單張圖片實現 AI 驅動的角色動畫
AI

Animate Anyone:從單張圖片實現 AI 驅動的角色動畫

Animate Anyone 是阿里巴巴 HumanAIGC 團隊的一項研究專案,能將單張照片轉變為人物行走、跳舞或執行任何姿勢序列的完整動畫影片——同時以非凡的保真度維持角色的身份、服裝和外觀。它代表了使用擴散模型進行影像到影片合成最令人印象深刻的應用之一。

ReasonFlux:透過思維模板擴展實現階層式 LLM 推理
AI

ReasonFlux:透過思維模板擴展實現階層式 LLM 推理

大型語言模型在一般知識與語言生成方面取得了令人矚目的進展,但複雜推理——多步驟數學問題、形式邏輯、演算法編碼——仍然是一個挑戰,特別是對於較小的模型。由 Gen-Verse 開發並被 NeurIPS 2025 接受的 ReasonFlux,從一個新穎的角度解決這個問題:與其擴大模型規模,不 …

MetaGPT:模擬 AI 軟體公司的多代理框架,擁有 65K 星星
AI

MetaGPT:模擬 AI 軟體公司的多代理框架,擁有 65K 星星

使用 AI 代理進行軟體開發的概念並不新鮮,但 MetaGPT 將它推向了前所未有的高度。它不是部署單一 AI 來撰寫程式碼,而是創建了一個完全由 AI 代理組成的模擬軟體公司——每個代理都有特定的角色、專業知識與責任。 由 FoundationAgents 開發,MetaGPT 已在 …

CutClaw:數小時 AI 影片編輯的開源多代理框架
AI

CutClaw:數小時 AI 影片編輯的開源多代理框架

影片編輯是一項耗時的工藝,隨著素材長度增加而難以擴展。一段 30 秒的社交短片可能需要手動編輯一小時。一段一小時的活動影片可能需要數天。CutClaw 是由 GVCLab 開發的開源框架,透過設計用於自主編輯數小時長度影片素材的多代理系統來解決這個問題。

TAG