图像生成

AI May 04, 2026

OmniGen2：进阶开源多模态生成模型

图像生成领域已变得日益碎片化。不同的模型处理文生图生成、图像编辑和风格转换。用户必须在一个令人困惑的专门工具生态系统中导航，每个工具都有自己的界面、提示格式和能力。OmniGen2 由 VectorSpaceLab 开发，以一个统一的单一架构中处理文生图、指令引导编辑和上下文内生成的多模态 …

AI May 02, 2026

StoryDiffusion 是南开大学与字节跳动的一项研究项目，针对生成式 AI 中最困难的问题之一：在长序列图像与视频中维持视觉一致性。作为一项重要的研究贡献，它引入了一种新颖的**一致性自注意力（CSA）**机制，使扩散模型能够生成连贯的漫画条、动画和视频——全部无需微调或逐序列训练 …

AI May 02, 2026

图像生成 AI 领域经历了工具的大爆发，但很少有工具能达到 ComfyUI 的主导地位和社区忠诚度。拥有超过 109,000 个 GitHub Stars，ComfyUI 已成为 Stable Diffusion 和其他扩散模型的权威开源界面，提供节点式可视化工作流程编辑器，让用户对其生成 …

AI May 01, 2026

OpenAI 的 GPT Image 2 于 2026 年 4 月发布，代表了 AI 图像生成领域的范式转移。它从纯扩散模型转向基于 GPT-4o 统一表征空间的自回归推理驱动架构，提供近乎完美的文字渲染、跨图像角色一致性，以及原生 2K 分辨率输出。但强大的能力也带来了复杂性——撰写能可 …