Post

博客

SoloSoft 关于软件工程、Hugo、网站性能与多语言内容发布的技术文章。

Animate Anyone:从单张图片实现 AI 驱动的角色动画
AI

Animate Anyone:从单张图片实现 AI 驱动的角色动画

Animate Anyone 是阿里巴巴 HumanAIGC 团队的一项研究项目,能将单张照片转变为人物行走、跳舞或执行任何姿势序列的完整动画视频——同时以非凡的保真度维持角色的身份、服装和外观。它代表了使用扩散模型进行图像到视频合成最令人印象深刻的应用之一。

ReasonFlux:通过思维模板扩展实现层次式 LLM 推理
AI

ReasonFlux:通过思维模板扩展实现层次式 LLM 推理

大型语言模型在一般知识与语言生成方面取得了令人瞩目的进展,但复杂推理——多步骤数学问题、形式逻辑、算法编码——仍然是一个挑战,特别是对于较小的模型。由 Gen-Verse 开发并被 NeurIPS 2025 接受的 ReasonFlux,从一个新颖的角度解决这个问题:与其扩大模型规模,不如 …

MetaGPT:模拟 AI 软件公司的多代理框架,拥有 65K 星标
AI

MetaGPT:模拟 AI 软件公司的多代理框架,拥有 65K 星标

使用 AI 代理进行软件开发的概念并不新鲜,但 MetaGPT 将它推向了前所未有的高度。它不是部署单一 AI 来编写代码,而是创建了一个完全由 AI 代理组成的模拟软件公司——每个代理都有特定的角色、专业知识与责任。 由 FoundationAgents 开发,MetaGPT 已在 …

CutClaw:数小时 AI 视频编辑的开源多代理框架
AI

CutClaw:数小时 AI 视频编辑的开源多代理框架

视频编辑是一项耗时的工艺,随着素材长度增加而难以扩展。一段 30 秒的社交短片可能需要手动编辑一小时。一段一小时的活动视频可能需要数天。CutClaw 是由 GVCLab 开发的开源框架,通过设计用于自主编辑数小时长度视频素材的多代理系统来解决这个问题。

TAG
CATEGORIES