"如何使用 LayoutParser？"

"LayoutParser 可通过 pip 安装。典型的布局检测流水线仅需 4 行 Python 代码即可运行，是现有最易用的文档 AI 库之一。"

"LayoutParser 支持哪些模型？"

"LayoutParser 提供包含预训练模型的模型动物园，包括用于 PubLayNet、Prima 和其他文档数据集的 Faster R-CNN、Mask R-CNN 和 RetinaNet。"

"LayoutParser 能与 OCR 引擎集成吗？"

"是的，LayoutParser 包含内置的 Tesseract OCR 集成，并支持可插拔的 OCR 后端，实现端到端的文档解析流水线。"

"如何引用 LayoutParser？"

"LayoutParser 有一篇相关的学术论文发表在 CVPR，可通过其官方 GitHub 仓库的引用文件进行引用。"

LayoutParser：用于文档图像分析的统一开源工具包

Q: "什么是 LayoutParser？"

"LayoutParser 是一个开源深度学习工具包，用于文档图像分析，提供统一的接口进行布局检测、OCR 和支持 Detectron2、TensorFlow 和 ADQ 的模型动物园。"

LayoutParser 是一个统一的深度学习工具包，用于文档图像分析，仅需 4 行代码即可实现布局检测、OCR 集成和模型动物园。

Keeping this site alive takes effort — your support means everything.

無程式碼也能輕鬆打造專業LINE官方帳號！一鍵導入模板，讓AI助你行銷加分！

技术编辑团队 May 03, 2026 阅读 3 分钟

LayoutParser 是为了终结文档处理混乱而建立的开源深度学习工具包。它提供了用于文档图像分析任务的统一接口，包括布局检测、OCR 集成和视觉信息提取。

仓库：github.com/Layout-Parser/layout-parser

核心功能

功能	描述	后端选项
布局检测	检测文档图像中的区域（文本、表格、图形）	Detectron2, TensorFlow, ADQ
OCR	从检测到的区域提取文本	Tesseract, 可插拔自定义引擎
模型动物园	常见文档数据集的预训练模型	PubLayNet, Prima, Newspaper

快速开始

pip install layoutparser

import layoutparser as lp
image = lp.load_image("document.png")
model = lp.DetectionModel("lp://PubLayNet/faster_rcnn_r50_fpn")
result = model.detect(image)
lp.draw_box(image, result, box_width=5).show()

模型动物园

数据集	可用模型	区域类型
PubLayNet	Faster R-CNN, Mask R-CNN, RetinaNet	文本, 标题, 表格, 图形, 列表
Prima	Faster R-CNN, Mask R-CNN	文本, 图像, 表格, 图形
Newspaper	Faster R-CNN	文本, 照片, 插图, 地图, 广告, 标题

OCR 集成

ocr_agent = lp.TesseractAgent()
text_blocks = ocr_agent.detect(image)

table_blocks = [b for b in result if b.type == "Table"]
for block in table_blocks:
    text = ocr_agent.detect(block.crop(image))
    print(text)

常见问题

什么是 LayoutParser？ 开源 Python 工具包，用于文档图像分析，将布局检测、OCR 和模型动物园统一在单一一致的 API 下。

如何使用？ pip install layoutparser，然后 4 行代码即可完成布局检测。

支持哪些模型？ 预训练 Faster R-CNN、Mask R-CNN 和 RetinaNet 模型。

能与 OCR 引擎集成吗？ 是的，内置 Tesseract 集成。

如何引用？ 在 LayoutParser 仓库的 CITATION 文件中获取。

LayoutParser：用于文档图像分析的统一开源工具包

核心功能

快速开始

模型动物园

OCR 集成

常见问题

扩展阅读

LATEST POST

马斯克、库克与芬克预计本周随特朗普访中代表团赴北京

佛州大学毕业典礼演讲者遭嘘声凸显世代价值观断层与言论风险

Workday、Anthropic 与 LISC 联手推出 AI 一人创业加速器

TAG

CATEGORIES

LayoutParser：用于文档图像分析的统一开源工具包

核心功能

快速开始

模型动物园

OCR 集成

常见问题

扩展阅读

LATEST POST

马斯克、库克与芬克预计本周随特朗普访中代表团赴北京

佛州大学毕业典礼演讲者遭嘘声 凸显世代价值观断层与言论风险

Workday、Anthropic 与 LISC 联手推出 AI 一人创业加速器

TAG

CATEGORIES

佛州大学毕业典礼演讲者遭嘘声凸显世代价值观断层与言论风险