Post

博客

SoloSoft 关于软件工程、Hugo、网站性能与多语言内容发布的技术文章。

PDF-Extract-Kit:全面的 PDF 内容提取工具包
AI

PDF-Extract-Kit:全面的 PDF 内容提取工具包

PDF 仍然是文档交换最常见的格式,但从其中提取结构化内容是出了名的困难。由 OpenDataLab 开发的 PDF-Extract-Kit 结合了深度学习模型与传统基于规则的方法,以卓越的准确度提取文字、表格、公式和图像。 该工具包解决了 PDF 提取的全面挑战。扫描文档使用 OCR 处 …

OpenClaw:开源 AI 代理平台
AI

OpenClaw:开源 AI 代理平台

AI 代理生态系统相当碎片化。每个代理构建工具都有自己的工具格式、部署模型和技能定义。OpenClaw 旨在通过一个开源平台来统一这个格局,该平台支持构建、部署和分享 AI 代理,并附带技能市场和原生 MCP 支持。 OpenClaw 提供了一个完整的代理开发环境。开发者可以使用可视化构建 …

NebulaGraph:开源分布式图数据库
Database

NebulaGraph:开源分布式图数据库

图数据库对于需要大规模遍历复杂关系的应用至关重要。由 vesoft-inc 开发的 NebulaGraph 是一个从头开始设计的分布式图数据库,用于处理万亿级边缘数据集,具有毫秒级查询延迟。 与将分布式附加到单节点设计上的图数据库不同,NebulaGraph 采用无共享架构构建,其中每个组 …

MCP TypeScript SDK:构建模型上下文协议服务器
AI

MCP TypeScript SDK:构建模型上下文协议服务器

模型上下文协议 (MCP) 正在迅速成为 AI 模型与外部工具和数据源交互的标准方式。由 Anthropic 开发的 MCP TypeScript SDK,为开发者提供了在 TypeScript 中构建 MCP 服务器和客户端所需的所有工具。 该 SDK 处理核心协议细节 …

macOS 动态壁纸:动态桌面背景
macOS

macOS 动态壁纸:动态桌面背景

macOS 用户少数羡慕 Windows 和 Linux 的桌面功能之一就是动态壁纸支持。由 thusvill 创建的 macOS 动态壁纸填补了这个空白,它是一款原生的 Swift 应用程序,为 macOS 带来性能优化渲染的动态视频壁纸。 与耗费资源、耗尽电池并拖慢系统的解决方案不同, …

LLM Scraper:使用 LLM 从网页中提取结构化数据
AI

LLM Scraper:使用 LLM 从网页中提取结构化数据

传统的网页抓取依赖于脆弱的 CSS 选择器和 XPath 表达式,一旦网站更新其标记就会失效。LLM Scraper 采用了根本不同的方法:它使用大型语言模型语义理解页面内容,并以结构化 JSON 的形式精确提取你需要的数据。 由 mishushakov 构建的这个开源工具弥合了非结构化 …

TAG
CATEGORIES