Tags

文档处理

Marker:使用深度学习的开源 PDF 转 Markdown 工具
AI

Marker:使用深度学习的开源 PDF 转 Markdown 工具

PDF 文档仍然是知识传播最常见的格式之一,然而它们也是最难以程序化处理的格式。跨页面的表格、多栏布局、数学方程式、页眉和页脚都共同导致了简单提取工具的失败。Marker 以深度学习方法应对这一挑战,像人类读者一样理解文档结构——通过识别视觉布局模式,而不仅仅是遵循文本顺序。

OmniParse:适用于 GenAI 管线的开源通用数据解析工具
AI

OmniParse:适用于 GenAI 管线的开源通用数据解析工具

现代 GenAI 应用程序会消费多种形式的数据——PDF、电子表格、图片、录音和视频文件。建立一个能摄取所有这些格式并产生干净、一致的结构化输出的 RAG 管线,是一项重大的工程挑战。OmniParse 通过提供一个通用数据摄取平台来解决这个问题,该平台可将任何非结构化数据转换为结构化 …

GPT-PDF:使用视觉 LLM 将 PDF 解析为 Markdown,仅需 293 行代码
AI

GPT-PDF:使用视觉 LLM 将 PDF 解析为 Markdown,仅需 293 行代码

PDF 文档是共享信息的通用格式,但对软件来说却出了名的难以解析。传统的 PDF 解析器在处理复杂布局、嵌入式表格、数学符号和多栏文本时往往力不从心。GPT-PDF 采取了一种截然不同的方法:它不是试图理解 PDF 的内部结构,而是让视觉 LLM 将每个页面视为图片来查看,并用干净的 …

TAG
CATEGORIES