AI

EverOS:開源自演化AI代理長期記憶作業系統

EverOS 是一款開源的 AI 代理長期記憶作業系統,透過超圖記憶與自演化能力,將複雜任務成功率提升 234%。

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
EverOS:開源自演化AI代理長期記憶作業系統

EverOS 是由 EverMind(盛大集團支援的 AI 研究實驗室)開發的開源 AI 代理長期記憶作業系統。在大多數 AI 代理僅具備短期、會話綁定記憶的時代,EverOS 引入了一套持久化、自組織的記憶基礎設施,讓代理能夠跨工作階段無限期地記憶、推理與演化。

該專案已獲得超過 4,200 個 GitHub 星星,並獲得多篇經同儕審查的論文支持,已被 ACL 2026 接受。其單體倉庫架構統一了四個核心元件:EverCore(自組織記憶作業系統)、HyperMem(超圖記憶引擎)、EverMemBench(三層記憶評估框架)以及 EvoAgentBench(代理自我演化基準測試)。

EverOS 真正突破性的地方在於其自我演化能力。代理可以自動從任務執行歷程中提煉技能與模式,使複雜任務成功率相較基準線提升 234.8%。這不僅僅是一個快取層——這是一個使用越久越聰明的活躍記憶體。

什麼是 EverOS?

EverOS 是一個長期記憶作業系統,設計在 AI 代理與其底層 LLM 後端之間。它提供一個持久化的記憶層,能夠自動提取、結構化、檢索並演化跨代理工作階段的知識。與簡單的向量儲存或對話歷史緩衝區不同,EverOS 將記憶組織成自組織超圖,明確建模並持續優化事實、事件與主題之間的關係。

該系統與模型無關,適用於多種 LLM 提供商,包括 OpenAI、Anthropic 以及開源模型。這使其適用範圍從單一代理編碼助手到大規模多代理編排平台。

EverOS 中的代理記憶如何運作?

EverOS 實作了一種受生物印刻啟發的三層記憶架構——這是生物體從短暫經驗中形成持久記憶的過程。

EverCore 是基礎層。它使用自組織方法提取、結構化並檢索長期知識。當代理完成一項任務時,EverCore 會分析互動過程,識別重要事實與模式,並將其編碼到記憶儲存中。在後續互動中,它會檢索相關記憶來輔助代理的推理過程。

HyperMem 提供儲存引擎。它建立在超圖資料結構之上,能夠捕捉簡單圖形無法表示的高階關聯。一條超邊緣可以同時連接多個節點,建模像「這五個事實共同解釋了概念 X」這樣的複雜關係。HyperMem 已被 ACL 2026 接受,並在 LoCoMo 長期對話基準測試中達到 92.73% 的準確率

mRAG(多模態 RAG) 是檢索層。它融合了三種檢索模式:

模態方法優勢
稠密向量基於嵌入的語義搜尋捕捉概念相似性
稀疏關鍵字BM25 風格的詞彙匹配精確詞彙比對
多模態對齊跨模態嵌入對齊處理文字、圖片與結構化資料

這種混合方法確保記憶檢索既具語義豐富性,又有事實精確性,在專案發表的基準測試中超越了單一模態 RAG 系統。

EverOS 使用哪些基準測試?

EverOS 內建兩個評估框架,用於衡量記憶與演化品質。

EverMemBench 評估三層記憶品質:

層級指標描述
事實回憶準確率、精確率、召回率代理能否正確檢索儲存的事實?
應用推理任務成功率、F1代理能否使用記憶解決複雜任務?
個人化泛化跨領域遷移分數記憶能否泛化到新的但相關的領域?

EvoAgentBench 衡量代理自我演化,追蹤代理在長期任務序列中的表現提升。已發表的結果顯示,使用 EverOS 的代理在超過 100 次任務迭代中,複雜任務成功率提升了 234.8%

超圖記憶與傳統方法相比如何?

傳統 RAG 系統使用儲存平面嵌入的向量資料庫。它們擅長尋找「相似」內容,但在多跳推理與關係建模方面表現不佳。知識圖譜透過明確建模實體與關係改善了這一點,但標準屬性圖無法表示涉及兩個以上實體的高階關係。

超圖記憶填補了這個缺口:

在超圖中,一條超邊緣可以連接任意數量的節點。這意味著像「使用者偏好 Python、有 FastAPI 經驗、參與過專案 P、並回報了問題 #42」這樣的記憶可以作為一個超圖單元儲存,而不是分散在多個成對關係中。HyperMem 的超邊緣在三個層級運作:主題事件事實,實現多粒度檢索。

EverOS 生態系統

除了核心元件,EverOS 還支援不斷擴展的整合與應用生態系統:

  • Claude Code 外掛 – Claude Code 工作階段的持久化記憶
  • OpenClaw 代理 – 具備持續學習能力的 24/7 代理
  • Live2D 角色 – 由記憶驅動的動漫角色互動體驗
  • 多代理編排 透過 Golutra 平台
  • Earth Online – 一款具備記憶感知的生產力遊戲

EverMind 還舉辦了 Memory Genesis Competition 2026,這是一項開放競賽,設有代理開發者、平台外掛建構者與作業系統基礎設施貢獻者等賽道,為最佳記憶應用提供獎項與認可。

開始使用 EverOS

EverOS 設計為易於本地部署:

git clone https://github.com/EverMind-AI/EverOS.git
cd EverOS
docker compose up -d
uv sync
# 配置 .env 的 API 金鑰
uv run python src/run.py

伺服器將在 http://localhost:1995 啟動,提供 REST API 與 Web 儀表板。您可以透過對 EverOS 記憶端點進行 API 呼叫,整合任何 LLM 驅動的代理。專案的文件網站提供了詳細的整合指南與 API 參考。

FAQ

什麼是 EverOS? EverOS 是 EverMind 開發的開源 AI 代理長期記憶作業系統。它讓代理能夠跨工作階段持久化、結構化並自我演化記憶,支援多種 LLM 後端與平台。

EverOS 的代理記憶如何運作? EverOS 採用受生物印刻啟發的三層架構:EverCore 負責自組織記憶、HyperMem 負責超圖層級儲存、mRAG 負責多模態檢索增強生成,融合稠密向量、稀疏關鍵字與多模態訊號。

什麼是 HyperMem? HyperMem 是一套基於超圖的層級記憶架構,已被 ACL 2026 接受。它透過主題、事件與事實層級的超邊緣捕捉高階關聯,在 LoCoMo 長期對話基準測試中達到 92.73% 準確率。

EverOS 支援哪些基準測試? EverOS 包含 EverMemBench(三層記憶品質評估:事實回憶、應用推理、個人化泛化)與 EvoAgentBench(衡量代理在長期任務中的自我演化表現)。

如何開始使用 EverOS?github.com/EverMind-AI/EverOS 複製倉庫,執行 docker compose up -d,使用 uv sync 同步依賴,配置 .env 檔案的 API 金鑰,然後執行 uv run python src/run.py。伺服器將在 http://localhost:1995 啟動。

延伸閱讀

TAG