Categories

开源

Nexus Skills:用于 AI 编码助手的原生代码库智能
AI

Nexus Skills:用于 AI 编码助手的原生代码库智能

Nexus Skills 是一个开源工具,解决 AI 辅助开发中最昂贵的问题之一:代码库上下文。当你告诉 AI 编码助手「找出用户验证在哪里处理」时,它要么需要将整个代码库放入其上下文窗口(消耗数千个 token),要么你必须手动搜索并粘贴相关文件(浪费你的时间)。Nexus Skills …

LightRAG:简单快速的图形检索增强生成框架
AI

LightRAG:简单快速的图形检索增强生成框架

LightRAG 是香港大学 (HKU) 的一项研究项目,重新构想了使用知识图谱的检索增强生成(RAG)。该项目已被 EMNLP 2025 收录,以基于图形的架构取代传统的平面向量存储方法,从文档中提取实体及其关系,为 LLM 应用提供显著更好的上下文理解。

Animate Anyone:从单张图片实现 AI 驱动的角色动画
AI

Animate Anyone:从单张图片实现 AI 驱动的角色动画

Animate Anyone 是阿里巴巴 HumanAIGC 团队的一项研究项目,能将单张照片转变为人物行走、跳舞或执行任何姿势序列的完整动画视频——同时以非凡的保真度维持角色的身份、服装和外观。它代表了使用扩散模型进行图像到视频合成最令人印象深刻的应用之一。

GPT-PDF:使用视觉 LLM 将 PDF 解析为 Markdown,仅需 293 行代码
AI

GPT-PDF:使用视觉 LLM 将 PDF 解析为 Markdown,仅需 293 行代码

PDF 文档是共享信息的通用格式,但对软件来说却出了名的难以解析。传统的 PDF 解析器在处理复杂布局、嵌入式表格、数学符号和多栏文本时往往力不从心。GPT-PDF 采取了一种截然不同的方法:它不是试图理解 PDF 的内部结构,而是让视觉 LLM 将每个页面视为图片来查看,并用干净的 …

TAG
CATEGORIES