QAnything: Motor RAG de Código Abierto de NetEase

QAnything es un motor de preguntas y respuestas para aplicaciones RAG que admite recuperación de documentos locales con comprensión multimodal y alta precisión.

Keeping this site alive takes effort — your support means everything.

無程式碼也能輕鬆打造專業LINE官方帳號！一鍵導入模板，讓AI助你行銷加分！

Equipo Editorial May 05, 2026 3 min de lectura

La Generación Aumentada por Recuperación (RAG) se ha convertido en la arquitectura estándar para fundamentar las respuestas de LLM en conocimiento real. QAnything, desarrollado por NetEase Youdao, es un motor RAG listo para producción que maneja el pipeline completo desde la ingesta de documentos hasta la generación de respuestas, con un enfoque particular en la recuperación precisa de colecciones de documentos locales.

Lo que distingue a QAnything es su enfoque en la precisión de recuperación. El sistema utiliza un pipeline de recuperación de dos etapas que combina métodos densos y dispersos, seguido de reordenamiento, para garantizar que el LLM reciba solo el contexto más relevante. Esto reduce drásticamente las alucinaciones mientras mantiene una alta recuperación.

Capacidades del Sistema

Característica	Descripción	Beneficio
Soporte multi-formato	PDF, Word, Excel, PPT, imágenes	Sin preprocesamiento
Recuperación en dos etapas	Denso + Disperso + Reordenamiento	Alta precisión y recuperación
Comprensión multimodal	Texto, tablas, imágenes en documentos	Comprensión completa
Despliegue local	Completamente on-premise	Privacidad de datos garantizada
Bases de conocimiento personalizadas	Múltiples colecciones aisladas	Organización fácil

Arquitectura del Pipeline RAG

flowchart LR
    A[Documentos] --> B[Analizador de Documentos]
    B --> C[Fragmentación y Embeddings]
    C --> D[Base de Datos Vectorial]
    E[Consulta de Usuario] --> F[Embedding de Consulta]
    D --> G[Recuperación Densa]
    F --> G
    D --> H[Recuperación Dispersa]
    F --> H
    G --> I[Fusión y Reordenamiento]
    H --> I
    I --> J[Montaje de Contexto LLM]
    J --> K[Generación de Respuesta]

El pipeline ingiere documentos mediante análisis y fragmentación, luego almacena embeddings en una base de datos vectorial. En la consulta, tanto la recuperación densa como la dispersa encuentran fragmentos relevantes, la fusión combina los resultados, el reordenamiento prioriza las mejores coincidencias, y el LLM genera respuestas basadas en el contexto ensamblado.

Métricas de Rendimiento

Métrica	QAnything	RAG de Referencia	Mejora
Recall@5	93.2%	82.1%	+11.1%
Precision@5	89.7%	76.4%	+13.3%
Precisión de respuesta	91.5%	78.2%	+13.3%
Latencia (promedio)	1.8s	2.1s	-14.3%

Para más información, visita el repositorio de GitHub de QAnything y el sitio web de documentación de QAnything.

Preguntas Frecuentes

Q: ¿Qué bases de datos vectoriales soporta QAnything? A: Soporta Milvus, FAISS, Elasticsearch y Qdrant listos para usar.

Q: ¿Puede QAnything manejar PDFs escaneados? A: Sí, integra OCR para documentos escaneados y contenido basado en imágenes.

Q: ¿Qué LLMs se pueden usar con QAnything? A: Soporta OpenAI, Anthropic y modelos locales a través de Ollama y vLLM.

Q: ¿Es QAnything adecuado para despliegue empresarial? A: Sí, soporta despliegue Docker, escalado horizontal y aislamiento multiinquilino.

Q: ¿Cómo maneja QAnything la extracción de tablas? A: Utiliza modelos especializados de análisis de tablas para preservar la estructura tabular en el contexto de recuperación.

QAnything: Motor RAG de Código Abierto de NetEase

Capacidades del Sistema

Arquitectura del Pipeline RAG

Métricas de Rendimiento

Preguntas Frecuentes

LATEST POST

Workday, Anthropic y LISC lanzan aceleradora de solopreneurs con IA

Sensor Tower adquiere AppMagic para reforzar su línea de análisis para pymes

Musk, Cook y Fink se espera que se unan a la delegación de Trump en Pekín esta s

TAG

CATEGORIES