AI

RAGFlow:用於文件理解的開源 RAG 引擎

RAGFlow 是一個開源 RAG 引擎,結合深度文件理解與 LLM,實現精確、附引用來源的問答。

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
RAGFlow:用於文件理解的開源 RAG 引擎

檢索增強生成(RAG)已成為將 LLM 回應基於事實資料的標準架構,但大多數 RAG 實作有一個根本弱點:它們將文件視為無差別的文字,將其切成任意區塊,失去所有結構意義。RAGFlow 採用根本不同的方法,結合深度文件理解與基於 LLM 的生成,提供精確、附引用來源的答案。

RAGFlow 由 infiniflow 開發,並已迅速獲得採用成為生產級 RAG 引擎。其核心創新在於使用佈局分析和視覺語言模型來理解文件的實際結構——在執行檢索之前識別標題、段落、表格、圖表、圖形及其層級關係。

這種深度文件理解使 RAGFlow 特別適用於企業文件場景——法律合約、財務報告、技術手冊、學術論文和政府文件——在這些場景中,資訊在結構化文件中的位置與資訊本身同樣重要。


RAGFlow 的文件處理流程如何運作?

RAGFlow 應用多個分析階段從文件中提取結構化理解。

graph TD
    A[輸入文件\nPDF / DOCX / 圖片] --> B[佈局分析\n視覺結構偵測]
    B --> C[OCR 引擎\n從圖片提取文字]
    B --> D[表格偵測\n行/列結構]
    B --> E[圖形分析\n圖表 / 圖形理解]
    C --> F[結構保留\n標題 + 正文 + 腳註]
    D --> F
    E --> F
    F --> G[語義分塊\n結構感知文字分割]
    G --> H[向量嵌入\n密集檢索索引]
    G --> I[關鍵字索引\n稀疏檢索]
    H --> J[混合檢索\n密集 + 稀疏搜尋]
    I --> J
    J --> K[LLM 生成\n答案 + 引用來源]

該流程在每個階段都保留文件結構,確保檢索尊重原始材料的邏輯組織。


RAGFlow 提供哪些功能?

RAGFlow 提供一套全面的功能,涵蓋文件處理、檢索和生成。

功能類別能力
文件解析佈局分析、OCR、表格提取、圖形分析、結構保留
支援格式PDF、DOCX、XLSX、PPTX、TXT、MD、HTML、EPUB、圖片、電子郵件
檢索方法密集向量搜尋、關鍵字搜尋、混合搜尋、重新排序
LLM 整合OpenAI、Claude、Gemini、本地模型(Ollama、vLLM、llama.cpp)
嵌入模型BGE、E5、Jina、Voyage、OpenAI、本地句子轉換器
UI 功能文件管理、知識庫配置、聊天介面、引用來源顯示

深度文件解析與靈活的 LLM 和嵌入選擇的結合,使 RAGFlow 能夠適應廣泛的企業需求。


RAGFlow 如何處理複雜文件類型?

不同的文件類型需要根本不同的解析策略,RAGFlow 為每種文件應用適當的方法。

文件類型解析策略關鍵挑戰
掃描 PDF完整 OCR 搭配佈局分析傾斜頁面、手寫
數位 PDF佈局分析 + 文字提取表格結構、多欄
Word DOCX內建 XML 結構格式變化
Excel XLSX細胞感知解析合併儲存格、公式
PowerPoint PPTX投影片層級佈局分析視覺元素、備註
圖片OCR + 視覺模型分析複雜佈局、混合內容

每條解析路徑都針對其來源格式進行最佳化,同時為下游檢索產生一致的結構化輸出。


RAGFlow 如何處理引用來源和歸因?

RAGFlow 為每個生成的答案提供詳細的來源歸因。

引用來源功能說明
來源追蹤每個生成的陳述連結回來源文件和頁碼
片段高亮在來源上下文中高亮相關段落
置信度分數文件檢索置信度顯示在答案旁邊
多來源匯總從多個文件綜合答案,附單獨引用來源
可追溯推理使用者可以根據原始來源驗證主張

引用來源系統專為答案驗證和可稽核性是關鍵要求的企業場景而設計。


常見問題

什麼是 RAGFlow? 開源 RAG 引擎,專門從事深度文件理解,使用視覺語言模型進行結構化解析。

與傳統 RAG 有何不同? 使用佈局分析和 OCR 保留文件結構,而非任意分塊。

支援哪些格式? PDF、DOCX、Excel、PPTX、TXT、MD、HTML、EPUB、圖片和電子郵件。

如何處理圖片和表格? 使用視覺語言模型進行細胞級表格解析和圖形語義分析。

可以與本地 LLM 配合使用嗎? 是的,支援 OpenAI、Claude、Gemini 以及透過 Ollama/vLLM 的本地模型。


延伸閱讀

TAG