Tags

图像生成

OmniGen2:进阶开源多模态生成模型
AI

OmniGen2:进阶开源多模态生成模型

图像生成领域已变得日益碎片化。不同的模型处理文生图生成、图像编辑和风格转换。用户必须在一个令人困惑的专门工具生态系统中导航,每个工具都有自己的界面、提示格式和能力。OmniGen2 由 VectorSpaceLab 开发,以一个统一的单一架构中处理文生图、指令引导编辑和上下文内生成的多模态 …

StoryDiffusion:用于长序列图像与视频生成的一致性自注意力机制
AI

StoryDiffusion:用于长序列图像与视频生成的一致性自注意力机制

StoryDiffusion 是南开大学与字节跳动的一项研究项目,针对生成式 AI 中最困难的问题之一:在长序列图像与视频中维持视觉一致性。作为一项重要的研究贡献,它引入了一种新颖的**一致性自注意力(CSA)**机制,使扩散模型能够生成连贯的漫画条、动画和视频——全部无需微调或逐序列训练 …

Awesome GPT Image 2:OpenAI 图像生成的开源终极提示词库
AI

Awesome GPT Image 2:OpenAI 图像生成的开源终极提示词库

OpenAI 的 GPT Image 2 于 2026 年 4 月发布,代表了 AI 图像生成领域的范式转移。它从纯扩散模型转向基于 GPT-4o 统一表征空间的自回归推理驱动架构,提供近乎完美的文字渲染、跨图像角色一致性,以及原生 2K 分辨率输出。但强大的能力也带来了复杂性——撰写能可 …

TAG
CATEGORIES