EverOS 是由 EverMind(盛大集團支援的 AI 研究實驗室)開發的開源 AI 代理長期記憶作業系統。在大多數 AI 代理僅具備短期、會話綁定記憶的時代,EverOS 引入了一套持久化、自組織的記憶基礎設施,讓代理能夠跨工作階段無限期地記憶、推理與演化。
該專案已獲得超過 4,200 個 GitHub 星星,並獲得多篇經同儕審查的論文支持,已被 ACL 2026 接受。其單體倉庫架構統一了四個核心元件:EverCore(自組織記憶作業系統)、HyperMem(超圖記憶引擎)、EverMemBench(三層記憶評估框架)以及 EvoAgentBench(代理自我演化基準測試)。
graph TD
A[代理/LLM] --> B[EverCore]
B --> C[HyperMem 超圖]
B --> D[mRAG 多模態檢索器]
C --> E[主題超邊緣]
C --> F[事件超邊緣]
C --> G[事實超邊緣]
D --> H[稠密向量]
D --> I[稀疏關鍵字]
D --> J[多模態訊號]
B --> K[演化技能]
K --> AEverOS 真正突破性的地方在於其自我演化能力。代理可以自動從任務執行歷程中提煉技能與模式,使複雜任務成功率相較基準線提升 234.8%。這不僅僅是一個快取層——這是一個使用越久越聰明的活躍記憶體。
什麼是 EverOS?
EverOS 是一個長期記憶作業系統,設計在 AI 代理與其底層 LLM 後端之間。它提供一個持久化的記憶層,能夠自動提取、結構化、檢索並演化跨代理工作階段的知識。與簡單的向量儲存或對話歷史緩衝區不同,EverOS 將記憶組織成自組織超圖,明確建模並持續優化事實、事件與主題之間的關係。
該系統與模型無關,適用於多種 LLM 提供商,包括 OpenAI、Anthropic 以及開源模型。這使其適用範圍從單一代理編碼助手到大規模多代理編排平台。
EverOS 中的代理記憶如何運作?
EverOS 實作了一種受生物印刻啟發的三層記憶架構——這是生物體從短暫經驗中形成持久記憶的過程。
EverCore 是基礎層。它使用自組織方法提取、結構化並檢索長期知識。當代理完成一項任務時,EverCore 會分析互動過程,識別重要事實與模式,並將其編碼到記憶儲存中。在後續互動中,它會檢索相關記憶來輔助代理的推理過程。
HyperMem 提供儲存引擎。它建立在超圖資料結構之上,能夠捕捉簡單圖形無法表示的高階關聯。一條超邊緣可以同時連接多個節點,建模像「這五個事實共同解釋了概念 X」這樣的複雜關係。HyperMem 已被 ACL 2026 接受,並在 LoCoMo 長期對話基準測試中達到 92.73% 的準確率。
mRAG(多模態 RAG) 是檢索層。它融合了三種檢索模式:
| 模態 | 方法 | 優勢 |
|---|---|---|
| 稠密向量 | 基於嵌入的語義搜尋 | 捕捉概念相似性 |
| 稀疏關鍵字 | BM25 風格的詞彙匹配 | 精確詞彙比對 |
| 多模態對齊 | 跨模態嵌入對齊 | 處理文字、圖片與結構化資料 |
這種混合方法確保記憶檢索既具語義豐富性,又有事實精確性,在專案發表的基準測試中超越了單一模態 RAG 系統。
EverOS 使用哪些基準測試?
EverOS 內建兩個評估框架,用於衡量記憶與演化品質。
EverMemBench 評估三層記憶品質:
| 層級 | 指標 | 描述 |
|---|---|---|
| 事實回憶 | 準確率、精確率、召回率 | 代理能否正確檢索儲存的事實? |
| 應用推理 | 任務成功率、F1 | 代理能否使用記憶解決複雜任務? |
| 個人化泛化 | 跨領域遷移分數 | 記憶能否泛化到新的但相關的領域? |
EvoAgentBench 衡量代理自我演化,追蹤代理在長期任務序列中的表現提升。已發表的結果顯示,使用 EverOS 的代理在超過 100 次任務迭代中,複雜任務成功率提升了 234.8%。
超圖記憶與傳統方法相比如何?
傳統 RAG 系統使用儲存平面嵌入的向量資料庫。它們擅長尋找「相似」內容,但在多跳推理與關係建模方面表現不佳。知識圖譜透過明確建模實體與關係改善了這一點,但標準屬性圖無法表示涉及兩個以上實體的高階關係。
超圖記憶填補了這個缺口:
graph LR
subgraph "向量資料庫"
A1[(嵌入 1)]
A2[(嵌入 2)]
A3[(嵌入 3)]
end
subgraph "屬性圖"
B1[實體 A] -- 關聯 --> B2[實體 B]
end
subgraph "超圖 HyperMem"
C1[事實 1]
C2[事實 2]
C3[事實 3]
C4{超邊緣 X} --- C1
C4 --- C2
C4 --- C3
end在超圖中,一條超邊緣可以連接任意數量的節點。這意味著像「使用者偏好 Python、有 FastAPI 經驗、參與過專案 P、並回報了問題 #42」這樣的記憶可以作為一個超圖單元儲存,而不是分散在多個成對關係中。HyperMem 的超邊緣在三個層級運作:主題、事件與事實,實現多粒度檢索。
EverOS 生態系統
除了核心元件,EverOS 還支援不斷擴展的整合與應用生態系統:
- Claude Code 外掛 – Claude Code 工作階段的持久化記憶
- OpenClaw 代理 – 具備持續學習能力的 24/7 代理
- Live2D 角色 – 由記憶驅動的動漫角色互動體驗
- 多代理編排 透過 Golutra 平台
- Earth Online – 一款具備記憶感知的生產力遊戲
EverMind 還舉辦了 Memory Genesis Competition 2026,這是一項開放競賽,設有代理開發者、平台外掛建構者與作業系統基礎設施貢獻者等賽道,為最佳記憶應用提供獎項與認可。
開始使用 EverOS
EverOS 設計為易於本地部署:
git clone https://github.com/EverMind-AI/EverOS.git
cd EverOS
docker compose up -d
uv sync
# 配置 .env 的 API 金鑰
uv run python src/run.py
伺服器將在 http://localhost:1995 啟動,提供 REST API 與 Web 儀表板。您可以透過對 EverOS 記憶端點進行 API 呼叫,整合任何 LLM 驅動的代理。專案的文件網站提供了詳細的整合指南與 API 參考。
FAQ
什麼是 EverOS? EverOS 是 EverMind 開發的開源 AI 代理長期記憶作業系統。它讓代理能夠跨工作階段持久化、結構化並自我演化記憶,支援多種 LLM 後端與平台。
EverOS 的代理記憶如何運作? EverOS 採用受生物印刻啟發的三層架構:EverCore 負責自組織記憶、HyperMem 負責超圖層級儲存、mRAG 負責多模態檢索增強生成,融合稠密向量、稀疏關鍵字與多模態訊號。
什麼是 HyperMem? HyperMem 是一套基於超圖的層級記憶架構,已被 ACL 2026 接受。它透過主題、事件與事實層級的超邊緣捕捉高階關聯,在 LoCoMo 長期對話基準測試中達到 92.73% 準確率。
EverOS 支援哪些基準測試? EverOS 包含 EverMemBench(三層記憶品質評估:事實回憶、應用推理、個人化泛化)與 EvoAgentBench(衡量代理在長期任務中的自我演化表現)。
如何開始使用 EverOS? 從 github.com/EverMind-AI/EverOS 複製倉庫,執行 docker compose up -d,使用 uv sync 同步依賴,配置 .env 檔案的 API 金鑰,然後執行 uv run python src/run.py。伺服器將在 http://localhost:1995 啟動。
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!