"RAGFlow 与传统的 RAG 系统有何不同？"

"传统的 RAG 系统通常将文档分割为固定大小的文本块，丢失结构信息。RAGFlow 使用布局分析和 OCR 进行深度文档解析，以理解文档的实际结构——识别标题、段落、表格、图形及其关系。"

"RAGFlow 支持哪些文档格式？"

"RAGFlow 支持广泛的文档格式，包括 PDF、DOCX、Excel、PPTX、TXT、Markdown、图片（用于 OCR）、HTML、EPUB 和电子邮件文件。"

"RAGFlow 如何处理文档中的图片和表格？"

"RAGFlow 使用视觉语言模型和布局检测来理解文档中的表格、图表、图形和图表。表格以单元格级精度解析，保留行列关系。"

"RAGFlow 可以与本地 LLM 配合使用吗？"

"是的，RAGFlow 设计为可与基于云 API 的 LLM（OpenAI、Claude、Gemini）和本地开源模型（Llama、Qwen、DeepSeek、Mistral）配合使用，通过 Ollama、vLLM 或 llama.cpp。"

RAGFlow：用于文档理解的开源 RAG 引擎

Q: "什么是 RAGFlow？"

"RAGFlow 是由 infiniflow 开发的开源检索增强生成（RAG）引擎，专门致力于深度文档理解。与任意将文档分块的简单 RAG 系统不同，RAGFlow 使用视觉语言模型和布局分析来理解文档结构——包括表格、图表、图形和复杂布局——然后再将相关上下文传递给 LLM 进行答案生成。"

RAGFlow 是一个开源 RAG 引擎，结合深度文档理解与 LLM，实现精确、附引用来源的问答。

Keeping this site alive takes effort — your support means everything.

無程式碼也能輕鬆打造專業LINE官方帳號！一鍵導入模板，讓AI助你行銷加分！

技术编辑团队 May 05, 2026 阅读 5 分钟

RAGFlow 结合深度文档理解与基于 LLM 的生成，提供精确、附引用来源的答案。

graph TD
    A[输入文档\nPDF / DOCX / 图片] --> B[布局分析\n视觉结构检测]
    B --> C[OCR 引擎\n从图片提取文字]
    B --> D[表格检测\n行/列结构]
    B --> E[图形分析\n图表 / 图形理解]
    C --> F[结构保留\n标题 + 正文 + 脚注]
    D --> F
    E --> F
    F --> G[语义分块\n结构感知文本分割]
    G --> H[向量嵌入\n密集检索索引]
    G --> I[关键字索引\n稀疏检索]
    H --> J[混合检索\n密集 + 稀疏搜索]
    I --> J
    J --> K[LLM 生成\n答案 + 引用来源]

功能类别	能力
文档解析	布局分析、OCR、表格提取、图形分析、结构保留
支持格式	PDF、DOCX、XLSX、PPTX、TXT、MD、HTML、EPUB、图片、电子邮件
检索方法	密集向量搜索、关键字搜索、混合搜索、重新排序
LLM 集成	OpenAI、Claude、Gemini、本地模型（Ollama、vLLM、llama.cpp）

文档类型	解析策略	关键挑战
扫描 PDF	完整 OCR 搭配布局分析	倾斜页面、手写
数字 PDF	布局分析 + 文本提取	表格结构、多列
Excel XLSX	单元格感知解析	合并单元格、公式
图片	OCR + 视觉模型分析	复杂布局、混合内容

引用功能	说明
源跟踪	每个生成的陈述链接回源文档和页码
置信度分数	文档检索置信度显示在答案旁边
多源汇总	从多个文档综合答案，附单独引用来源

常见问题

什么是 RAGFlow？ 开源 RAG 引擎，专门从事深度文档理解，使用视觉语言模型进行结构化解析。

与传统 RAG 有何不同？ 使用布局分析和 OCR 保留文档结构，而非任意分块。

支持哪些格式？ PDF、DOCX、Excel、PPTX、TXT、MD、HTML、EPUB、图片和电子邮件。

如何处理图片和表格？ 使用视觉语言模型进行单元格级表格解析和图形语义分析。

可以与本地 LLM 配合使用吗？ 是的，支持 OpenAI、Claude、Gemini 以及通过 Ollama/vLLM 的本地模型。

RAGFlow：用于文档理解的开源 RAG 引擎

常见问题

延伸阅读

LATEST POST

马斯克、库克与芬克预计本周随特朗普访中代表团赴北京

佛州大学毕业典礼演讲者遭嘘声凸显世代价值观断层与言论风险

Workday、Anthropic 与 LISC 联手推出 AI 一人创业加速器

TAG

CATEGORIES

RAGFlow：用于文档理解的开源 RAG 引擎

常见问题

延伸阅读

LATEST POST

马斯克、库克与芬克预计本周随特朗普访中代表团赴北京

佛州大学毕业典礼演讲者遭嘘声 凸显世代价值观断层与言论风险

Workday、Anthropic 与 LISC 联手推出 AI 一人创业加速器

TAG

CATEGORIES

佛州大学毕业典礼演讲者遭嘘声凸显世代价值观断层与言论风险