Tags

文档分析

RapidLayout:开源中英文文档版面分析工具
AI

RapidLayout:开源中英文文档版面分析工具

文档版面分析是任何文档理解管线中至关重要的第一步。在 OCR 提取文本之前、在表格被解析之前、在内容被分类之前,系统需要先了解事物在页面上的位置。RapidLayout 是 RapidAI 团队开发的开源库,专注于解决这一挑战,并同时支持中英文文档内容。

GOT-OCR2.0:迈向 OCR-2.0 的通用 OCR 理论与统一端到端模型
AI

GOT-OCR2.0:迈向 OCR-2.0 的通用 OCR 理论与统一端到端模型

光学字符识别(OCR)几十年来一直被视为已解决的问题——对于具有简单文本的清晰扫描文档而言。但真实世界的视觉内容远更杂乱多样。带有复杂符号的数学方程、具有不规则单元格结构的表格、带有专门符号的乐谱,以及招牌和标签上的场景文本,都挑战了假设干净、线性文本在均匀背景上的传统 OCR 方法。

LayoutParser:用于文档图像分析的统一开源工具包
AI

LayoutParser:用于文档图像分析的统一开源工具包

LayoutParser 是为了终结文档处理混乱而建立的开源深度学习工具包。它提供了用于文档图像分析任务的统一接口,包括布局检测、OCR 集成和视觉信息提取。 仓库:github.com/Layout-Parser/layout-parser 核心功能 功能 描述 后端选项 布局检测 检测 …

TAG
CATEGORIES