AI

LightRAG: Marco de Generación Aumentada por Recuperación Simple y Rápido Basado en Grafos

LightRAG es un proyecto de investigación de EMNLP 2025 de HKU que utiliza grafos de conocimiento para RAG con recuperación de doble nivel, actualizaciones incrementales y visualización de grafos.

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
LightRAG: Marco de Generación Aumentada por Recuperación Simple y Rápido Basado en Grafos

LightRAG es un proyecto de investigación de la Universidad de Hong Kong (HKU) que reinventa la generación aumentada por recuperación (RAG) utilizando grafos de conocimiento. Aceptado en EMNLP 2025, reemplaza el enfoque tradicional de almacén de vectores planos con una arquitectura basada en grafos que extrae entidades y sus relaciones de los documentos, permitiendo una comprensión contextual dramáticamente mejor para aplicaciones LLM.

Mientras que los sistemas RAG convencionales recuperan fragmentos de documentos aislados por similitud de embeddings, LightRAG construye un grafo de conocimiento estructurado a partir de tus documentos – las entidades se convierten en nodos, las relaciones en aristas. Cuando llega una consulta, realiza recuperación de doble nivel a través de este grafo: recuperación de bajo nivel para respuestas factuales específicas, recuperación de alto nivel para resúmenes temáticos más amplios. El resultado es una recuperación que entiende no solo qué palabras aparecen juntas, sino cómo los conceptos están realmente conectados.

El proyecto ha atraído una atención significativa de la comunidad de código abierto no solo por su enfoque novedoso, sino por ser práctico. El código es ligero, bien documentado e incluye características como actualizaciones incrementales (sin reconstrucción completa al añadir nuevos documentos), visualización interactiva de grafos y soporte para múltiples backends (OpenAI, Ollama, Hugging Face).

Repositorio: github.com/HKUDS/LightRAG


Cómo Funciona la Recuperación Basada en Grafos de LightRAG?

El RAG tradicional codifica documentos como vectores planos y recupera fragmentos por similitud de coseno – un proceso fundamentalmente limitado porque no tiene comprensión de cómo se relacionan los fragmentos entre sí. LightRAG resuelve esto construyendo un grafo de conocimiento durante la fase de indexación.

El pipeline funciona en tres fases:

  1. Construcción del Grafo: Los documentos se procesan para extraer entidades (personas, empresas, conceptos) y sus relaciones. Estos forman un grafo dirigido almacenado como datos estructurados.
  2. Detección de Comunidades: El grafo se particiona en comunidades de entidades relacionadas mediante agrupamiento jerárquico. Cada comunidad genera un embedding de resumen para recuperación de alto nivel.
  3. Recuperación de Doble Nivel: Las consultas se comparan tanto con embeddings a nivel de entidad como de comunidad, luego el contexto del grafo recuperado se alimenta al LLM para generar la respuesta.

Ventajas de la Recuperación de Doble Nivel

Tipo de ConsultaRAG TradicionalLightRAG Doble Nivel
“Qué adquirió Apple en 2020?”Busca fragmentos que mencionan “Apple”, “2020” y “adquisición”Recuperación de bajo nivel: sigue directamente la arista [Apple] --adquirió--> [Startup X]
“Cuál es la estrategia de adquisición de Apple?”Dispersa entre fragmentos no relacionadosRecuperación de alto nivel: devuelve el resumen comunitario de todo el clúster “adquisiciones de Apple”
“Cómo se compara la estrategia de IA de Apple con la de Google?”Difícil conectar grupos de fragmentos separadosAtraviesa ambos clústeres y devuelve contexto de grafo combinado
“Explica la línea temporal del desarrollo de chips de Apple”Puede perder conexiones cronológicasRecuperación de bajo nivel sigue aristas temporales

Especificaciones Clave

CaracterísticaDescripciónEstado
Construcción de GrafosExtracción de entidades y relacionesEstable
Recuperación de Doble NivelConsultas de bajo nivel y alto nivelEstable
Actualizaciones IncrementalesFusionar nuevos documentos sin reconstrucciónEstable
Visualización de GrafosExplorador interactivo entidad-relaciónEstable
Múltiples BackendsOpenAI, Ollama, Hugging Face, API personalizadaSoportado
Acceso APIPython SDK + API RESTfulEstable

Cómo Funcionan las Actualizaciones Incrementales?

Backends Soportados

BackendCaso de UsoConfiguración
OpenAI (GPT-4o, GPT-4o-mini)Despliegues en producción con LLM cloudLIGHTRAG_LLM_BACKEND=openai
OllamaDespliegues locales/privadosLIGHTRAG_LLM_BACKEND=ollama
Hugging FaceModelos personalizados del HF hubLIGHTRAG_LLM_BACKEND=huggingface
Endpoint PersonalizadoProxies empresariales o APIs auto-alojadasLIGHTRAG_LLM_BACKEND=custom

Instalación y Uso

pip install lightrag-hku
from lightrag import LightRAG, QueryMode

rag = LightRAG(workspace_dir="./my_knowledge_base")

rag.insert("Apple adquirió la startup X en 2020 para expandir sus capacidades de IA.")
rag.insert("Google lanzó su modelo Gemini en 2023, compitiendo con GPT-4.")

answer = rag.query("Cuál es la estrategia de adquisición de Apple?",
                   mode=QueryMode.HYBRID)

fact = rag.query("Qué adquirió Apple en 2020?",
                 mode=QueryMode.LOCAL)

FAQ

Qué es LightRAG y en qué se diferencia del RAG tradicional? LightRAG es un proyecto de investigación de EMNLP 2025 de HKU que reemplaza la recuperación plana con un enfoque de grafo de conocimiento, permitiendo recuperación de doble nivel.

Cómo funciona la recuperación de doble nivel? Opera en dos granularidades: bajo nivel para relaciones de entidades específicas y alto nivel para resúmenes más amplios, seleccionando automáticamente el nivel apropiado según la consulta.

Soporta actualizaciones incrementales? Sí, mediante reconstrucción parcial del grafo. Los nuevos documentos se fusionan sin reconstrucción completa.

Qué capacidades de visualización ofrece? Visualizaciones interactivas con entidades como nodos y relaciones como aristas, codificadas por colores por clúster comunitario.

Qué backends soporta? OpenAI, Ollama, Hugging Face y endpoints personalizados, con API de Python y RESTful.

Lecturas Adicionales

TAG
CATEGORIES