AI

BELLE: Modelo de Lenguaje Chino de Código Abierto por Lianjia

BELLE es un proyecto de LLM chino de código abierto ajustado en BLOOM y LLaMA con 2M muestras de instrucción, avanzando la IA conversacional china.

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
BELLE: Modelo de Lenguaje Chino de Código Abierto por Lianjia

BELLE (Be Everyone’s Large Language model Engine) fue creado para cerrar la brecha entre los modelos de lenguaje grandes centrados en inglés y las alternativas en chino.

Repositorio: github.com/LianjiaTech/BELLE


Diferenciadores

DiferenciadorBELLEOtros LLMs Chinos
Modelo BaseBLOOM + LLaMAPrincipalmente LLaMA o ChatGLM
Datos de EntrenamientoEstilo Alpaca, traducidosVaría ampliamente
Enfoque de InvestigaciónEvaluación de seguimiento de instruccionesA menudo pre-entrenamiento
TransparenciaModelos y datos completosA menudo solo parcial

Arquitectura

Variantes

VarianteArquitectura BaseParámetrosDatos de Entrenamiento
BELLE-7BBLOOMZ-7B1-MT7B2M instrucciones
BELLE-LLaMA-7BLLaMA-7B7B2M instrucciones
BELLE-LLaMA-13BLLaMA-13B13B2M instrucciones
BELLE-7B-0.5MBLOOMZ-7B1-MT7B0.5M instrucciones

Rendimiento

TareaBELLE-7B (2M)BELLE-LLaMA-7B (2M)Línea Base
Traducción (BLEU)28.427.122.3
Resumen (ROUGE-L)32.731.526.8
Preguntas y Respuestas (F1)64.262.856.1

Despliegue

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "BelleGroup/BELLE-7B-2M"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

inputs = tokenizer("¿Qué es el aprendizaje profundo?", return_tensors="pt")
outputs = model.generate(**inputs, max_length=100)
print(tokenizer.decode(outputs[0]))

FAQ

Qué es BELLE? Proyecto de LLM chino de código abierto ajustado en BLOOM y LLaMA con 2M muestras de instrucción.

Variantes? BELLE-7B (BLOOMZ), BELLE-LLaMA-7B, BELLE-LLaMA-13B.

Dataset? 2M pares instrucción-respuesta en chino (train_2M_CN).

Limitaciones? Puede producir información plausible pero incorrecta.

Licencia? Solo para investigación.

Lecturas Adicionales

TAG
CATEGORIES