"BELLE (Be Everyone's Large Language model Engine) es un proyecto de LLM chino de código abierto de Lianjia Technology, ajustado en las arquitecturas BLOOM y LLaMA con enfoque en capacidades de seguimiento de instrucciones."

"Qué variantes de modelo ofrece BELLE?"

"BELLE ofrece múltiples variantes incluyendo BELLE-7B basado en BLOOMZ-7B1, BELLE-LLaMA-7B y BELLE-LLaMA-13B, con versiones especializadas para chat."

"Qué tan grande es el dataset de entrenamiento de BELLE?"

"El proyecto BELLE publicó 2 millones de muestras de instrucción en chino junto con variantes de 0.5M y 1M, todas derivadas del pipeline de generación de datos de Stanford Alpaca pero traducidas y filtradas para chino."

"Cuáles son las limitaciones de BELLE?"

"Los modelos BELLE comparten las mismas limitaciones arquitectónicas que sus modelos base, y como modelos ajustados por instrucciones pueden producir información que suena plausible pero es incorrecta."

"Cuál es la licencia de BELLE?"

"BELLE se publica solo para fines de investigación, heredando las licencias de sus modelos base que restringen el uso comercial."

BELLE: Modelo de Lenguaje Chino de Código Abierto por Lianjia

BELLE es un proyecto de LLM chino de código abierto ajustado en BLOOM y LLaMA con 2M muestras de instrucción, avanzando la IA conversacional china.

Keeping this site alive takes effort — your support means everything.

無程式碼也能輕鬆打造專業LINE官方帳號！一鍵導入模板，讓AI助你行銷加分！

Equipo Editorial May 03, 2026 2 min de lectura

BELLE (Be Everyone’s Large Language model Engine) fue creado para cerrar la brecha entre los modelos de lenguaje grandes centrados en inglés y las alternativas en chino.

Repositorio: github.com/LianjiaTech/BELLE

Diferenciadores

Diferenciador	BELLE	Otros LLMs Chinos
Modelo Base	BLOOM + LLaMA	Principalmente LLaMA o ChatGLM
Datos de Entrenamiento	Estilo Alpaca, traducidos	Varía ampliamente
Enfoque de Investigación	Evaluación de seguimiento de instrucciones	A menudo pre-entrenamiento
Transparencia	Modelos y datos completos	A menudo solo parcial

Arquitectura

graph TD
    subgraph "Familia de Modelos BELLE"
        A[BLOOMZ-7B1-MT] --> B[BELLE-7B]
        A2[LLaMA-7B] --> C[BELLE-LLaMA-7B]
        A3[LLaMA-13B] --> D[BELLE-LLaMA-13B]
        B --> E[BELLE-7B-2M]
        B --> F[BELLE-7B-0.5M]
        C --> G[BELLE-LLaMA-7B-2M]
    end

Variantes

Variante	Arquitectura Base	Parámetros	Datos de Entrenamiento
BELLE-7B	BLOOMZ-7B1-MT	7B	2M instrucciones
BELLE-LLaMA-7B	LLaMA-7B	7B	2M instrucciones
BELLE-LLaMA-13B	LLaMA-13B	13B	2M instrucciones
BELLE-7B-0.5M	BLOOMZ-7B1-MT	7B	0.5M instrucciones

Rendimiento

Tarea	BELLE-7B (2M)	BELLE-LLaMA-7B (2M)	Línea Base
Traducción (BLEU)	28.4	27.1	22.3
Resumen (ROUGE-L)	32.7	31.5	26.8
Preguntas y Respuestas (F1)	64.2	62.8	56.1

Despliegue

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "BelleGroup/BELLE-7B-2M"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

inputs = tokenizer("¿Qué es el aprendizaje profundo?", return_tensors="pt")
outputs = model.generate(**inputs, max_length=100)
print(tokenizer.decode(outputs[0]))

FAQ

Qué es BELLE? Proyecto de LLM chino de código abierto ajustado en BLOOM y LLaMA con 2M muestras de instrucción.

Variantes? BELLE-7B (BLOOMZ), BELLE-LLaMA-7B, BELLE-LLaMA-13B.

Dataset? 2M pares instrucción-respuesta en chino (train_2M_CN).

Limitaciones? Puede producir información plausible pero incorrecta.

Licencia? Solo para investigación.

BELLE: Modelo de Lenguaje Chino de Código Abierto por Lianjia

Diferenciadores

Arquitectura

Variantes

Rendimiento

Despliegue

FAQ

Lecturas Adicionales

LATEST POST

Workday, Anthropic y LISC lanzan aceleradora de solopreneurs con IA

Sensor Tower adquiere AppMagic para reforzar su línea de análisis para pymes

Musk, Cook y Fink se espera que se unan a la delegación de Trump en Pekín esta s

TAG

CATEGORIES