EverOS 是由 EverMind(盛大集团支持的 AI 研究实验室)开发的开源 AI 代理长期记忆操作系统。在大多数 AI 代理仅具备短期、会话绑定记忆的时代,EverOS 引入了一套持久化、自组织的记忆基础设施,让代理能够跨会话无限期地记忆、推理与进化。
该项目已获得超过 4,200 个 GitHub 星标,并获多篇经同行评审的论文支持,已被 ACL 2026 接收。其单体仓库架构统一了四个核心组件:EverCore(自组织记忆操作系统)、HyperMem(超图记忆引擎)、EverMemBench(三层记忆评估框架)以及 EvoAgentBench(代理自我进化基准测试)。
graph TD
A[代理/LLM] --> B[EverCore]
B --> C[HyperMem 超图]
B --> D[mRAG 多模态检索器]
C --> E[主题超边]
C --> F[事件超边]
C --> G[事实超边]
D --> H[稠密向量]
D --> I[稀疏关键词]
D --> J[多模态信号]
B --> K[进化技能]
K --> AEverOS 真正突破性的地方在于其自我进化能力。代理可以自动从任务执行历程中提炼技能与模式,使复杂任务成功率相较基线提升 234.8%。这不仅仅是一个缓存层——这是一个越用越聪明的活跃记忆体。
什么是 EverOS?
EverOS 是一个长期记忆操作系统,设计在 AI 代理与其底层 LLM 后端之间。它提供一个持久化的记忆层,能够自动提取、结构化、检索并进化跨代理会话的知识。与简单的向量存储或对话历史缓冲区不同,EverOS 将记忆组织成自组织超图,明确建模并持续优化事实、事件与主题之间的关系。
该系统与模型无关,适用于多种 LLM 提供商,包括 OpenAI、Anthropic 以及开源模型。这使其适用范围从单一代码助手到大规模多代理编排平台。
EverOS 中的代理记忆如何工作?
EverOS 实现了一种受生物印刻启发的三层记忆架构——这是生物体从短暂经验中形成持久记忆的过程。
EverCore 是基础层。它使用自组织方法提取、结构化并检索长期知识。当代理完成一项任务时,EverCore 会分析交互过程,识别重要事实与模式,并将其编码到记忆存储中。在后续交互中,它会检索相关记忆来辅助代理的推理过程。
HyperMem 提供存储引擎。它建立在超图数据结构之上,能够捕获简单图形无法表示的高阶关联。一条超边可以同时连接多个节点,建模像「这五个事实共同解释了概念 X」这样的复杂关系。HyperMem 已被 ACL 2026 接收,并在 LoCoMo 长期对话基准测试中达到 92.73% 的准确率。
mRAG(多模态 RAG) 是检索层。它融合了三种检索模式:
| 模态 | 方法 | 优势 |
|---|---|---|
| 稠密向量 | 基于嵌入的语义搜索 | 捕获概念相似性 |
| 稀疏关键词 | BM25 风格的词汇匹配 | 精确词汇匹配 |
| 多模态对齐 | 跨模态嵌入对齐 | 处理文本、图片与结构化数据 |
这种混合方法确保记忆检索既具语义丰富性,又有事实精确性,在项目发表的基准测试中超越了单模态 RAG 系统。
EverOS 使用哪些基准测试?
EverOS 内置两个评估框架,用于衡量记忆与进化质量。
EverMemBench 评估三层记忆质量:
| 层级 | 指标 | 描述 |
|---|---|---|
| 事实回忆 | 准确率、精确率、召回率 | 代理能否正确检索存储的事实? |
| 应用推理 | 任务成功率、F1 | 代理能否使用记忆解决复杂任务? |
| 个性化泛化 | 跨领域迁移分数 | 记忆能否泛化到新的但相关的领域? |
EvoAgentBench 衡量代理自我进化,追踪代理在长期任务序列中的表现提升。已发表的结果显示,使用 EverOS 的代理在超过 100 次任务迭代中,复杂任务成功率提升了 234.8%。
超图记忆与传统方法相比如何?
传统 RAG 系统使用存储平面嵌入的向量数据库。它们擅长寻找「相似」内容,但在多跳推理与关系建模方面表现不佳。知识图谱通过明确建模实体与关系改善了这一点,但标准属性图无法表示涉及两个以上实体的高阶关系。
超图记忆填补了这个缺口:
graph LR
subgraph "向量数据库"
A1[(嵌入 1)]
A2[(嵌入 2)]
A3[(嵌入 3)]
end
subgraph "属性图"
B1[实体 A] -- 关联 --> B2[实体 B]
end
subgraph "超图 HyperMem"
C1[事实 1]
C2[事实 2]
C3[事实 3]
C4{超边 X} --- C1
C4 --- C2
C4 --- C3
end在超图中,一条超边可以连接任意数量的节点。这意味着像「用户偏好 Python、有 FastAPI 经验、参与过项目 P、并报告了问题 #42」这样的记忆可以作为一个超图单元存储,而不是分散在多个成对关系中。HyperMem 的超边在三个层级运作:主题、事件与事实,实现多粒度检索。
EverOS 生态系统
除核心组件外,EverOS 还支持不断扩展的集成与应用生态系统:
- Claude Code 插件 – Claude Code 会话的持久化记忆
- OpenClaw 代理 – 具备持续学习能力的 24/7 代理
- Live2D 角色 – 由记忆驱动的动漫角色交互体验
- 多代理编排 通过 Golutra 平台
- Earth Online – 一款具备记忆感知的生产力游戏
EverMind 还举办了 Memory Genesis Competition 2026,这是一项开放竞赛,设有代理开发者、平台插件构建者与操作系统基础设施贡献者等赛道,为最佳记忆应用提供奖项与认可。
开始使用 EverOS
EverOS 设计为易于本地部署:
git clone https://github.com/EverMind-AI/EverOS.git
cd EverOS
docker compose up -d
uv sync
# 配置 .env 的 API 密钥
uv run python src/run.py
服务器将在 http://localhost:1995 启动,提供 REST API 与 Web 仪表板。您可以通过对 EverOS 记忆端点进行 API 调用,集成任何 LLM 驱动的代理。项目的文档网站提供了详细的集成指南与 API 参考。
FAQ
什么是 EverOS? EverOS 是 EverMind 开发的开源 AI 代理长期记忆操作系统。它让代理能够跨会话持久化、结构化并自我进化记忆,支持多种 LLM 后端与平台。
EverOS 的代理记忆如何工作? EverOS 采用受生物印刻启发的三层架构:EverCore 负责自组织记忆、HyperMem 负责超图层级存储、mRAG 负责多模态检索增强生成,融合稠密向量、稀疏关键词与多模态信号。
什么是 HyperMem? HyperMem 是一套基于超图的层级记忆架构,已被 ACL 2026 接收。它通过主题、事件与事实层级的超边捕获高阶关联,在 LoCoMo 长期对话基准测试中达到 92.73% 准确率。
EverOS 支持哪些基准测试? EverOS 包含 EverMemBench(三层记忆质量评估:事实回忆、应用推理、个性化泛化)与 EvoAgentBench(衡量代理在长期任务中的自我进化表现)。
如何开始使用 EverOS? 从 github.com/EverMind-AI/EverOS 克隆仓库,运行 docker compose up -d,使用 uv sync 同步依赖,配置 .env 文件的 API 密钥,然后运行 uv run python src/run.py。服务器将在 http://localhost:1995 启动。
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!