检索增强生成已成为将 LLM 响应建立在事实知识上的标准方法。但标准 RAG 有一个众所周知的限制:它在处理需要跨多个文档或实体连接信息的多跳问题时表现不佳。当一个问题问到「电话发明者出生国家的首都是什么?」时,答案需要在知识图谱中追踪一条路径——这是平面文本检索难以处理的。GNN-RAG 通过将图神经网络集成到 RAG 流水线中来解决这个问题。
由研究员 cmavro 开发,GNN-RAG 代表了两种强大 AI 范式的融合:图神经网络的结构化推理和大型语言模型的生成流畅性。核心见解在于,许多复杂问题需要标准密集检索无法捕捉的关系推理。通过将检索到的信息建模为图,并应用 GNN 消息传递在连接的实体之间传播信息,GNN-RAG 在构建更丰富的上下文表示后再将其传递给 LLM。
该项目在 AI 研究社区中引起关注,因为它在多个多跳问答基准上取得了最先进的结果,同时保持了计算效率。它证明了检索流水线本身可以通过图结构化计算变得更智能。
GNN-RAG 的图感知检索如何工作?
GNN-RAG 流水线在文档检索和 LLM 生成之间添加了一个图推理层。
graph TD
A[多跳问题] --> B[初始检索\n密集 + 稀疏搜索]
B --> C[实体与关系提取]
C --> D[(知识子图)]
D --> E[GNN 消息传递\nK 层]
E --> F[节点表示\n以图上下文丰富化]
F --> G[上下文聚合\nTop-K 节点摘要]
G --> H[LLM 答案生成]
H --> I[基于事实的回答]
D --> J[外部知识图谱\nWikidata / DBpedia]
J --> D
关键创新在于 GNN 消息传递阶段。子图中的每个节点从其文本内容的初始表示开始。通过多轮消息传递,节点表示根据其邻居进行更新,捕捉平面检索方法看不见的关系上下文。
GNN-RAG 在基准数据集上表现如何?
该项目报告了与基准 RAG 方法相比,在多跳推理任务上的显著改进。
| 数据集 | 标准 RAG | GNN-RAG | 改进 |
|---|---|---|---|
| HotpotQA(F1) | 72.4 | 78.9 | +6.5 |
| 2WikiMultihopQA(F1) | 68.1 | 75.3 | +7.2 |
| MuSiQue(F1) | 62.7 | 69.8 | +7.1 |
| WebQSP(F1) | 74.2 | 80.1 | +5.9 |
| CWQ(F1) | 68.9 | 74.5 | +5.6 |
这些改进在数据集上是一致的,表明图增强方法提供了普遍的好处,而非针对特定基准进行调整。
关键技术组件有哪些?
GNN-RAG 系统由几个可以独立配置的模块化组件构成。
| 组件 | 功能 | 配置选项 |
|---|---|---|
| 检索器 | 初始文档/实体检索 | 密集(DPR)、稀疏(BM25)、混合 |
| 图构建器 | 建立知识子图 | 实体链接、关系提取 |
| GNN 编码器 | 图消息传递 | GCN、GAT、GraphSAGE |
| 上下文聚合器 | 为 LLM 汇总图 | Top-K、注意力加权、基于路径 |
| LLM 生成器 | 最终答案生成 | Flan-T5、LLaMA、GPT、Claude |
模块化设计允许研究人员独立实验不同的 GNN 架构和检索策略。GNN 编码器支持多种消息传递方案,包括图卷积网络、图注意力网络和 GraphSAGE。
常见问题
什么是 GNN-RAG? GNN-RAG 是一个研究项目,结合图神经网络(GNN)与检索增强生成(RAG),以改善知识图谱上的多跳推理。它使用 GNN 在图结构中传播信息,然后将丰富化后的表示馈入 LLM 进行答案生成。
GNN-RAG 如何改进标准 RAG? 标准 RAG 独立检索文档或文本块,并将其作为平面上下文传递给 LLM。GNN-RAG 更进一步,将检索到的信息表示为图,使用 GNN 消息传递来建模实体之间的关系,并生成利用这种关系结构的答案。
GNN-RAG 支持哪些知识图谱? GNN-RAG 可与多种知识图谱格式协作,包括 Wikidata、DBpedia 以及自定义领域特定图谱。系统还可以在检索阶段从非结构化文本中提取实体和关系,动态构建图谱。
评估使用了哪些数据集? GNN-RAG 已在多跳问答基准上进行评估,包括 HotpotQA、2WikiMultihopQA 和 MuSiQue,以及知识图谱特定基准如 WebQSP 和 CWQ。结果显示其持续优于纯 RAG 和纯图谱方法。
GNN-RAG 可以与任何 LLM 搭配使用吗? 可以,GNN-RAG 是模型无关的,可以与任何预训练的 LLM 结合。GNN 增强的检索上下文作为提示的一部分馈入 LLM,因此它与开源模型和 API 型 LLM 都能兼容,无需修改。
延伸阅读
- GNN-RAG GitHub 仓库 – 源代码、评估脚本和预训练模型
- HotpotQA 数据集 – 用于评估的多跳问答数据集
- 图神经网络概述 – Distill.pub 对 GNN 和消息传递的介绍
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!