"RAGFlow 與傳統 RAG 系統有何不同？"

"傳統 RAG 系統通常將文件分割為固定大小的文字區塊，遺失結構資訊。RAGFlow 使用佈局分析和 OCR 進行深度文件解析，以理解文件的實際結構——識別標題、段落、表格、圖形及其關係。這保留了文件的語義結構，實現更精確的檢索。"

"RAGFlow 支援哪些文件格式？"

"RAGFlow 支援廣泛的文件格式，包括 PDF、DOCX、Excel、PPTX、TXT、Markdown、圖片（用於 OCR）、HTML、EPUB 和電子郵件檔案。對於每種格式，它應用適當的解析策略——PDF 使用佈局分析、DOCX 使用內建結構、Excel 使用細胞感知解析、掃描圖片使用 OCR。"

"RAGFlow 如何處理文件中的圖片和表格？"

"RAGFlow 使用視覺語言模型和佈局偵測來理解文件中的表格、圖表、圖形和圖表。表格以細胞級精度解析，保留行列關係。圖形被分析和語義描述。這使得檢索和回答能夠基於圖像和表格內容，而不僅僅是文字。"

"RAGFlow 可以與本地 LLM 配合使用嗎？"

"是的，RAGFlow 設計為可與基於雲端 API 的 LLM（OpenAI、Claude、Gemini）和本地開源模型（Llama、Qwen、DeepSeek、Mistral）配合使用，透過 Ollama、vLLM 或 llama.cpp。這種靈活性允許在無法將資料發送到外部 API 的氣隙或隱私敏感環境中進行部署。"

RAGFlow：用於文件理解的開源 RAG 引擎

Q: "什麼是 RAGFlow？"

"RAGFlow 是由 infiniflow 開發的開源檢索增強生成（RAG）引擎，專門致力於深度文件理解。與任意將文件分塊的簡單 RAG 系統不同，RAGFlow 使用視覺語言模型和佈局分析來理解文件結構——包括表格、圖表、圖形和複雜佈局——然後再將相關上下文傳遞給 LLM 進行答案生成。"

RAGFlow 是一個開源 RAG 引擎，結合深度文件理解與 LLM，實現精確、附引用來源的問答。

Keeping this site alive takes effort — your support means everything.

無程式碼也能輕鬆打造專業LINE官方帳號！一鍵導入模板，讓AI助你行銷加分！

技術編輯團隊 May 05, 2026 閱讀 8 分鐘

檢索增強生成（RAG）已成為將 LLM 回應基於事實資料的標準架構，但大多數 RAG 實作有一個根本弱點：它們將文件視為無差別的文字，將其切成任意區塊，失去所有結構意義。RAGFlow 採用根本不同的方法，結合深度文件理解與基於 LLM 的生成，提供精確、附引用來源的答案。

RAGFlow 由 infiniflow 開發，並已迅速獲得採用成為生產級 RAG 引擎。其核心創新在於使用佈局分析和視覺語言模型來理解文件的實際結構——在執行檢索之前識別標題、段落、表格、圖表、圖形及其層級關係。

這種深度文件理解使 RAGFlow 特別適用於企業文件場景——法律合約、財務報告、技術手冊、學術論文和政府文件——在這些場景中，資訊在結構化文件中的位置與資訊本身同樣重要。

RAGFlow 的文件處理流程如何運作？

RAGFlow 應用多個分析階段從文件中提取結構化理解。

graph TD
    A[輸入文件\nPDF / DOCX / 圖片] --> B[佈局分析\n視覺結構偵測]
    B --> C[OCR 引擎\n從圖片提取文字]
    B --> D[表格偵測\n行/列結構]
    B --> E[圖形分析\n圖表 / 圖形理解]
    C --> F[結構保留\n標題 + 正文 + 腳註]
    D --> F
    E --> F
    F --> G[語義分塊\n結構感知文字分割]
    G --> H[向量嵌入\n密集檢索索引]
    G --> I[關鍵字索引\n稀疏檢索]
    H --> J[混合檢索\n密集 + 稀疏搜尋]
    I --> J
    J --> K[LLM 生成\n答案 + 引用來源]

該流程在每個階段都保留文件結構，確保檢索尊重原始材料的邏輯組織。

RAGFlow 提供哪些功能？

RAGFlow 提供一套全面的功能，涵蓋文件處理、檢索和生成。

功能類別	能力
文件解析	佈局分析、OCR、表格提取、圖形分析、結構保留
支援格式	PDF、DOCX、XLSX、PPTX、TXT、MD、HTML、EPUB、圖片、電子郵件
檢索方法	密集向量搜尋、關鍵字搜尋、混合搜尋、重新排序
LLM 整合	OpenAI、Claude、Gemini、本地模型（Ollama、vLLM、llama.cpp）
嵌入模型	BGE、E5、Jina、Voyage、OpenAI、本地句子轉換器
UI 功能	文件管理、知識庫配置、聊天介面、引用來源顯示

深度文件解析與靈活的 LLM 和嵌入選擇的結合，使 RAGFlow 能夠適應廣泛的企業需求。

RAGFlow 如何處理複雜文件類型？

不同的文件類型需要根本不同的解析策略，RAGFlow 為每種文件應用適當的方法。

文件類型	解析策略	關鍵挑戰
掃描 PDF	完整 OCR 搭配佈局分析	傾斜頁面、手寫
數位 PDF	佈局分析 + 文字提取	表格結構、多欄
Word DOCX	內建 XML 結構	格式變化
Excel XLSX	細胞感知解析	合併儲存格、公式
PowerPoint PPTX	投影片層級佈局分析	視覺元素、備註
圖片	OCR + 視覺模型分析	複雜佈局、混合內容

每條解析路徑都針對其來源格式進行最佳化，同時為下游檢索產生一致的結構化輸出。

RAGFlow 如何處理引用來源和歸因？

RAGFlow 為每個生成的答案提供詳細的來源歸因。

引用來源功能	說明
來源追蹤	每個生成的陳述連結回來源文件和頁碼
片段高亮	在來源上下文中高亮相關段落
置信度分數	文件檢索置信度顯示在答案旁邊
多來源匯總	從多個文件綜合答案，附單獨引用來源
可追溯推理	使用者可以根據原始來源驗證主張

引用來源系統專為答案驗證和可稽核性是關鍵要求的企業場景而設計。

常見問題

什麼是 RAGFlow？ 開源 RAG 引擎，專門從事深度文件理解，使用視覺語言模型進行結構化解析。

與傳統 RAG 有何不同？ 使用佈局分析和 OCR 保留文件結構，而非任意分塊。

支援哪些格式？ PDF、DOCX、Excel、PPTX、TXT、MD、HTML、EPUB、圖片和電子郵件。

如何處理圖片和表格？ 使用視覺語言模型進行細胞級表格解析和圖形語義分析。

可以與本地 LLM 配合使用嗎？ 是的，支援 OpenAI、Claude、Gemini 以及透過 Ollama/vLLM 的本地模型。

RAGFlow：用於文件理解的開源 RAG 引擎

RAGFlow 的文件處理流程如何運作？

RAGFlow 提供哪些功能？

RAGFlow 如何處理複雜文件類型？

RAGFlow 如何處理引用來源和歸因？

常見問題

延伸閱讀

LATEST POST

馬斯克、庫克與芬克預計本週隨川普訪中代表團赴北京

佛州大學畢業典禮演講者遭噓聲凸顯世代價值觀斷層與言論風險

Workday、Anthropic 與 LISC 聯手推出 AI 一人創業加速器

TAG

CATEGORIES

RAGFlow：用於文件理解的開源 RAG 引擎

RAGFlow 的文件處理流程如何運作？

RAGFlow 提供哪些功能？

RAGFlow 如何處理複雜文件類型？

RAGFlow 如何處理引用來源和歸因？

常見問題

延伸閱讀

LATEST POST

馬斯克、庫克與芬克預計本週隨川普訪中代表團赴北京

佛州大學畢業典禮演講者遭噓聲 凸顯世代價值觀斷層與言論風險

Workday、Anthropic 與 LISC 聯手推出 AI 一人創業加速器

TAG

CATEGORIES

佛州大學畢業典禮演講者遭噓聲凸顯世代價值觀斷層與言論風險