"BELLE（Be Everyone's Large Language model Engine）是链家科技的一个开源中文大型语言模型项目，基于 BLOOM 和 LLaMA 架构微调，专注于指令遵循能力。"

"BELLE 提供哪些模型变体？"

"BELLE 提供多种模型变体，包括基于 BLOOMZ-7B1 的 BELLE-7B、BELLE-LLaMA-7B 和 BELLE-LLaMA-13B，以及专门的聊天版本。"

"BELLE 的训练数据集有多大？"

"BELLE 项目发布了 200 万条中文指令样本（BelleGroup/train_2M_CN），以及 50 万和 100 万的变体，全部来自 Stanford Alpaca 数据生成流水线，但经过中文翻译和过滤。"

"BELLE 有哪些限制？"

"BELLE 模型共享其基础模型（BLOOM/LLaMA）的相同架构限制，作为指令微调模型，有时可能产生听起来合理但不正确的信息。"

"BELLE 的许可证是什么？"

"BELLE 仅用于研究目的发布，继承其基础模型限制商业使用的许可证。用户应在仓库上验证最新的许可条款。"

BELLE：链家科技开源中文大型语言模型

BELLE 是一个开源中文 LLM 项目，基于 BLOOM 和 LLaMA 微调，拥有 200 万条指令样本，推动中文对话式 AI 发展。

Keeping this site alive takes effort — your support means everything.

無程式碼也能輕鬆打造專業LINE官方帳號！一鍵導入模板，讓AI助你行銷加分！

技术编辑团队 May 03, 2026 阅读 3 分钟

BELLE（Be Everyone’s Large Language model Engine）是链家科技为了缩小中文与英文大语言模型差距而创建的开源项目。

仓库：github.com/LianjiaTech/BELLE

与其他中文 LLM 比较

差异点	BELLE	其他中文 LLM
基础模型	BLOOM + LLaMA 变体	主要为 LLaMA 或 ChatGLM
训练数据	Alpaca 风格，翻译并策划	差异很大
研究重点	指令遵循评估	通常侧重于预训练
透明度	完整发布模型和数据	通常仅部分发布

模型架构

graph TD
    subgraph "BELLE 模型家族"
        A[BLOOMZ-7B1-MT] --> B[BELLE-7B]
        A2[LLaMA-7B] --> C[BELLE-LLaMA-7B]
        A3[LLaMA-13B] --> D[BELLE-LLaMA-13B]
        B --> E[BELLE-7B-2M]
        B --> F[BELLE-7B-0.5M]
        C --> G[BELLE-LLaMA-7B-2M]
    end

模型变体	基础架构	参数	训练数据大小
BELLE-7B	BLOOMZ-7B1-MT	7B	200 万指令
BELLE-LLaMA-7B	LLaMA-7B	7B	200 万指令
BELLE-LLaMA-13B	LLaMA-13B	13B	200 万指令
BELLE-7B-0.5M	BLOOMZ-7B1-MT	7B	50 万指令

基准测试

评估任务	BELLE-7B (2M)	BELLE-LLaMA-7B (2M)	基线 (基础模型)
中文翻译 (BLEU)	28.4	27.1	22.3
文本摘要 (ROUGE-L)	32.7	31.5	26.8
中文问答 (F1)	64.2	62.8	56.1
安全与偏见	通过	通过	通过

部署

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "BelleGroup/BELLE-7B-2M"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

inputs = tokenizer("什么是深度学习？", return_tensors="pt")
outputs = model.generate(**inputs, max_length=100)
print(tokenizer.decode(outputs[0]))

常见问题

什么是 BELLE？ 链家科技的开源中文 LLM 项目，基于 BLOOM 和 LLaMA 架构，使用 200 万中文指令样本进行指令微调。

模型变体？ 基于 BLOOMZ-7B1-MT、LLaMA-7B 和 LLaMA-13B。

数据集大小？ 最大数据集含 200 万中文指令-响应对。

限制？ 可能产生听起来合理但不正确的信息。

许可证？ 仅用于研究目的。

BELLE：链家科技开源中文大型语言模型

与其他中文 LLM 比较

模型架构

基准测试

部署

常见问题

扩展阅读

LATEST POST

马斯克、库克与芬克预计本周随特朗普访中代表团赴北京

佛州大学毕业典礼演讲者遭嘘声凸显世代价值观断层与言论风险

Workday、Anthropic 与 LISC 联手推出 AI 一人创业加速器

TAG

CATEGORIES

BELLE：链家科技开源中文大型语言模型

与其他中文 LLM 比较

模型架构

基准测试

部署

常见问题

扩展阅读

LATEST POST

马斯克、库克与芬克预计本周随特朗普访中代表团赴北京

佛州大学毕业典礼演讲者遭嘘声 凸显世代价值观断层与言论风险

Workday、Anthropic 与 LISC 联手推出 AI 一人创业加速器

TAG

CATEGORIES

佛州大学毕业典礼演讲者遭嘘声凸显世代价值观断层与言论风险