Tags

深度学习

ColossalAI:开源大规模 AI 训练框架
AI

ColossalAI:开源大规模 AI 训练框架

ColossalAI 提供从单一 GPU 到数千个 GPU 扩展训练所需的并行原语。 graph TD A[模型 + 数据] --> B{并行策略} B --> C[数据并行\n跨设备批次分割] B --> D[张量并行\n层内操作分割] B --> E[流水线并行 …

Marker:使用深度学习的开源 PDF 转 Markdown 工具
AI

Marker:使用深度学习的开源 PDF 转 Markdown 工具

PDF 文档仍然是知识传播最常见的格式之一,然而它们也是最难以程序化处理的格式。跨页面的表格、多栏布局、数学方程式、页眉和页脚都共同导致了简单提取工具的失败。Marker 以深度学习方法应对这一挑战,像人类读者一样理解文档结构——通过识别视觉布局模式,而不仅仅是遵循文本顺序。

LayoutParser:用于文档图像分析的统一开源工具包
AI

LayoutParser:用于文档图像分析的统一开源工具包

LayoutParser 是为了终结文档处理混乱而建立的开源深度学习工具包。它提供了用于文档图像分析任务的统一接口,包括布局检测、OCR 集成和视觉信息提取。 仓库:github.com/Layout-Parser/layout-parser 核心功能 功能 描述 后端选项 布局检测 检测 …

TAG
CATEGORIES