Tags

RAG

Bisheng:開源 LLM 應用開發平台
AI

Bisheng:開源 LLM 應用開發平台

企業組織一直是 LLM 技術最快的採用者之一,但它們面臨獨特的挑戰:嚴格的安全要求、複雜的文件格式、合規義務以及對可稽核性的需求。Bisheng 以一個專為企業 RAG 部署打造的開源平台來應對這些挑戰。由 dataelement 創造,Bisheng 已成為需要建構生產級 LLM 應用而 …

OmniParse:適用於 GenAI 管線的開源通用資料解析工具
AI

OmniParse:適用於 GenAI 管線的開源通用資料解析工具

現代 GenAI 應用程式會消費多種形式的資料——PDF、試算表、圖片、錄音和影片檔案。建立一個能攝取所有這些格式並產生乾淨、一致的結構化輸出的 RAG 管線,是一項重大的工程挑戰。OmniParse 透過提供一個通用資料攝取平台來解決這個問題,該平台可將任何非結構化資料轉換為結構化 …

HippoRAG:受神經生物學啟發的 LLM 長期記憶(NeurIPS 2024)
AI

HippoRAG:受神經生物學啟發的 LLM 長期記憶(NeurIPS 2024)

檢索增強生成(RAG)已成為將 LLM 輸出錨定於外部知識的標準方法。但標準 RAG 有一個根本限制:它將每個查詢視為獨立事件,沒有對過去檢索的記憶,也無法跨文件連接資訊。HippoRAG 從人類大腦的海馬體中汲取靈感來克服這一限制,創建了一個能大幅改善多跳問答的長期記憶系統。

LightRAG:簡單快速的圖形檢索增強生成框架
AI

LightRAG:簡單快速的圖形檢索增強生成框架

LightRAG 是香港大學 (HKU) 的一項研究專案,重新想像了使用知識圖譜的檢索增強生成(RAG)。該專案已被 EMNLP 2025 收錄,以基於圖形的架構取代傳統的平面向量儲存方法,從文件中提取實體及其關係,為 LLM 應用提供顯著更好的上下文理解。

Open Parse:以視覺驅動的文件解析器,為 LLM 就緒的 RAG 管線而生
AI

Open Parse:以視覺驅動的文件解析器,為 LLM 就緒的 RAG 管線而生

RAG(檢索增強生成)生態系統已快速成熟,但有一個瓶頸始終存在:垃圾進,垃圾出。大多數文件解析工具在未理解文件視覺結構的情況下,將原始文字送入 LLM 管線,產生的區塊會將標題與其內容分離、將表格跨頁分割,並失去了使文件可讀的語義層級結構。Filimoa 的 Open Parse 從根源解 …

TAG