AI

GNN-RAG:图神经网络增强的检索增强生成

GNN-RAG 结合图神经网络与 RAG,在知识图谱上实现更强的多跳推理,在复杂问答任务上达到更高的准确度。

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
GNN-RAG:图神经网络增强的检索增强生成

检索增强生成已成为将 LLM 响应建立在事实知识上的标准方法。但标准 RAG 有一个众所周知的限制:它在处理需要跨多个文档或实体连接信息的多跳问题时表现不佳。当一个问题问到「电话发明者出生国家的首都是什么?」时,答案需要在知识图谱中追踪一条路径——这是平面文本检索难以处理的。GNN-RAG 通过将图神经网络集成到 RAG 流水线中来解决这个问题。

由研究员 cmavro 开发,GNN-RAG 代表了两种强大 AI 范式的融合:图神经网络的结构化推理和大型语言模型的生成流畅性。核心见解在于,许多复杂问题需要标准密集检索无法捕捉的关系推理。通过将检索到的信息建模为图,并应用 GNN 消息传递在连接的实体之间传播信息,GNN-RAG 在构建更丰富的上下文表示后再将其传递给 LLM。

该项目在 AI 研究社区中引起关注,因为它在多个多跳问答基准上取得了最先进的结果,同时保持了计算效率。它证明了检索流水线本身可以通过图结构化计算变得更智能。


GNN-RAG 的图感知检索如何工作?

GNN-RAG 流水线在文档检索和 LLM 生成之间添加了一个图推理层。

graph TD
    A[多跳问题] --> B[初始检索\n密集 + 稀疏搜索]
    B --> C[实体与关系提取]
    C --> D[(知识子图)]
    D --> E[GNN 消息传递\nK 层]
    E --> F[节点表示\n以图上下文丰富化]
    F --> G[上下文聚合\nTop-K 节点摘要]
    G --> H[LLM 答案生成]
    H --> I[基于事实的回答]
    D --> J[外部知识图谱\nWikidata / DBpedia]
    J --> D

关键创新在于 GNN 消息传递阶段。子图中的每个节点从其文本内容的初始表示开始。通过多轮消息传递,节点表示根据其邻居进行更新,捕捉平面检索方法看不见的关系上下文。


GNN-RAG 在基准数据集上表现如何?

该项目报告了与基准 RAG 方法相比,在多跳推理任务上的显著改进。

数据集标准 RAGGNN-RAG改进
HotpotQA(F1)72.478.9+6.5
2WikiMultihopQA(F1)68.175.3+7.2
MuSiQue(F1)62.769.8+7.1
WebQSP(F1)74.280.1+5.9
CWQ(F1)68.974.5+5.6

这些改进在数据集上是一致的,表明图增强方法提供了普遍的好处,而非针对特定基准进行调整。


关键技术组件有哪些?

GNN-RAG 系统由几个可以独立配置的模块化组件构成。

组件功能配置选项
检索器初始文档/实体检索密集(DPR)、稀疏(BM25)、混合
图构建器建立知识子图实体链接、关系提取
GNN 编码器图消息传递GCN、GAT、GraphSAGE
上下文聚合器为 LLM 汇总图Top-K、注意力加权、基于路径
LLM 生成器最终答案生成Flan-T5、LLaMA、GPT、Claude

模块化设计允许研究人员独立实验不同的 GNN 架构和检索策略。GNN 编码器支持多种消息传递方案,包括图卷积网络、图注意力网络和 GraphSAGE。


常见问题

什么是 GNN-RAG? GNN-RAG 是一个研究项目,结合图神经网络(GNN)与检索增强生成(RAG),以改善知识图谱上的多跳推理。它使用 GNN 在图结构中传播信息,然后将丰富化后的表示馈入 LLM 进行答案生成。

GNN-RAG 如何改进标准 RAG? 标准 RAG 独立检索文档或文本块,并将其作为平面上下文传递给 LLM。GNN-RAG 更进一步,将检索到的信息表示为图,使用 GNN 消息传递来建模实体之间的关系,并生成利用这种关系结构的答案。

GNN-RAG 支持哪些知识图谱? GNN-RAG 可与多种知识图谱格式协作,包括 Wikidata、DBpedia 以及自定义领域特定图谱。系统还可以在检索阶段从非结构化文本中提取实体和关系,动态构建图谱。

评估使用了哪些数据集? GNN-RAG 已在多跳问答基准上进行评估,包括 HotpotQA、2WikiMultihopQA 和 MuSiQue,以及知识图谱特定基准如 WebQSP 和 CWQ。结果显示其持续优于纯 RAG 和纯图谱方法。

GNN-RAG 可以与任何 LLM 搭配使用吗? 可以,GNN-RAG 是模型无关的,可以与任何预训练的 LLM 结合。GNN 增强的检索上下文作为提示的一部分馈入 LLM,因此它与开源模型和 API 型 LLM 都能兼容,无需修改。


延伸阅读

TAG
CATEGORIES