Tags

OCR

GOT-OCR2.0:迈向 OCR-2.0 的通用 OCR 理论与统一端到端模型
AI

GOT-OCR2.0:迈向 OCR-2.0 的通用 OCR 理论与统一端到端模型

光学字符识别(OCR)几十年来一直被视为已解决的问题——对于具有简单文本的清晰扫描文档而言。但真实世界的视觉内容远更杂乱多样。带有复杂符号的数学方程、具有不规则单元格结构的表格、带有专门符号的乐谱,以及招牌和标签上的场景文本,都挑战了假设干净、线性文本在均匀背景上的传统 OCR 方法。

PaddleOCR:百度支持 80+ 语言的超轻量 OCR 工具包
AI

PaddleOCR:百度支持 80+ 语言的超轻量 OCR 工具包

PaddleOCR 是百度基于 PaddlePaddle 深度学习框架的工业级超轻量光学字符识别 (OCR) 工具包。作为 GitHub 上最受欢迎的开源 OCR 项目之一,PaddleOCR 已发展多个主要版本——目前包括用于文本检测与识别的 PP-OCRv5、用于全面文档解析的 …

LayoutParser:用于文档图像分析的统一开源工具包
AI

LayoutParser:用于文档图像分析的统一开源工具包

LayoutParser 是为了终结文档处理混乱而建立的开源深度学习工具包。它提供了用于文档图像分析任务的统一接口,包括布局检测、OCR 集成和视觉信息提取。 仓库:github.com/Layout-Parser/layout-parser 核心功能 功能 描述 后端选项 布局检测 检测 …

TAG
CATEGORIES