Tags

PDF

pypdf:纯 Python PDF 工具包
Python

pypdf:纯 Python PDF 工具包

当你在 Python 中操作 PDF 而不需要大量外部依赖时,pypdf 是首选解决方案。这个纯 Python 库提供了全面的 PDF 操作能力,包括分割、合并、裁剪、旋转、加密和文字提取,全部无需任何原生代码或系统库。 Pypdf 作为标准的 Python PDF 库已有超过十年的历史。 …

PyMuPDF:用于 Python 的高性能 PDF 处理
Python

PyMuPDF:用于 Python 的高性能 PDF 处理

当你需要 PDF 处理的原始速度时,PyMuPDF 是 Python PDF 库中的性能领导者。PyMuPDF 构建为 Artifex 基于 C 语言的 MuPDF 库的 Python 绑定,结合了 Python 的易用性与 C 语言级别的渲染、提取和操作 PDF 文档的性能。 …

PDFPlumber:使用 Python 从 PDF 提取文字、表格和元资料
Python

PDFPlumber:使用 Python 从 PDF 提取文字、表格和元资料

PDF 仍然是分发文件最常見的格式之一,但以程式化方式从中提取资料一直具有挑戰性。PDF 格式保留视觉版面,但犧牲了结构语義,使得区分表格与欄位版面或标题与正文文字变得困难。PDFPlumber(GitHub 上的 jsvine/pdfplumber)透過提供一个 Python 函式库来应 …

html2pdf.js:使用 JavaScript 在客户端将 HTML 转换为 PDF
JavaScript

html2pdf.js:使用 JavaScript 在客户端将 HTML 转换为 PDF

从网页内容生成 PDF 是幾乎每个网页应用程式都会遇到的需求,但要正确实作卻出了名地困难。html2pdf.js(GitHub 上的 eKoopmans/html2pdf.js)透過提供一个简单的客户端 JavaScript 函式库解決了这个问题,它可以直接在浏览器中将 HTML 元素转换 …

TAG
CATEGORIES