AI

GLM-4:智譜 AI 的開源雙語 LLM

GLM-4 是智譜 AI 的開源雙語中英文語言模型,在推理、程式碼和多語言任務上表現出色。

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
GLM-4:智譜 AI 的開源雙語 LLM

大型語言模型的格局長期以來以英文優先發展為主。OpenAI、Anthropic、Google、Meta 和 Mistral 都以其旗艦模型以英文為主要語言,透過翻譯或混合訓練資料將多語言能力作為事後補充。這為數十億主要使用非英文與 AI 互動的使用者帶來了實際問題——尤其是中文,它代表了世界上最大的語言社群。

GLM-4 由智譜 AI 開發——中國領先的 AI 公司之一,由清華大學研究人員支持——採取了根本不同的方法。它是一個從頭開始為中文和英文建立的雙語基礎模型,兩種語言都沒有被視為次要語言。結果是一個在中文基準測試上匹配或超越 GPT-4,同時在英文任務上保持競爭力的模型,使其成為 2026 年領先的開源中英文雙語 LLM。

GLM 架構本身值得關注。與 GPT 風格的僅解碼器模型不同,GLM(通用語言模型)使用一個統一的預訓練框架,結合了自迴歸空白填充和多任務學習。該架構最初在 2024 年由智譜 AI 和清華大學發表的論文中提出,已被證明對中文文字理解特別有效,因為模型的雙向注意力有助於捕捉中文字元及其複合意義的上下文細微差別。

效能基準測試

GLM-4 在中文和英文基準測試上都展現了強勁的表現:

基準測試GLM-4-130BGPT-4Claude 3 OpusQwen 2.5-72B
C-Eval(中文)86.5%82.3%78.1%84.2%
CMMLU(中文)83.2%79.8%76.4%81.5%
MMLU(英文)87.1%86.4%86.9%85.3%
HumanEval(程式碼)74.3%78.2%79.1%71.8%
GSM8K(數學)92.5%87.1%88.4%90.3%
AgentBench72.1%68.7%70.2%69.4%

資料顯示了 GLM-4 的特定優勢:它在中文基準測試(C-Eval、CMMLU)和數學推理(GSM8K)上領先,同時在英文任務和程式碼上保持競爭力。這使其成為同時服務中文和英文使用者的雙語應用程式的絕佳選擇。

模型架構與變體

GLM-4 模型生態系統包括針對不同部署場景最佳化的多種變體:

部署與可及性

GLM-4 可透過多種管道取得,使研究人員和商業使用者都能使用:

平台變體存取方式使用案例
Hugging FaceGLM-4-9B、GLM-4-9B-Chat開放權重研究、微調
ModelScope所有變體開放權重中文 AI 生態系統
智譜 APIGLM-4-130BAPI 存取生產服務
OllamaGLM-4-9B本地推論開發

GLM-4 GitHub 儲存庫 提供模型卡片、推論程式碼、微調腳本和部署指南。

常見問題

什麼是 GLM-4?

GLM-4 是智譜 AI 的開源雙語(中文-英文)大型語言模型,建立在通用語言模型(GLM)架構之上。它在推理、程式碼、數學和多語言任務上表現出色,特別是在中文語言理解方面具有優勢。

GLM-4 在中文任務上與 GPT-4 相比如何?

GLM-4 在 C-Eval、CMMLU 和中文常識推理等中文語言基準測試上達到具有競爭力或優越的表現。它特別擅長中文特定應用,如文言文翻譯、中文法律文件分析和中文文學理解。

GLM-4 是開源的嗎?

是的,智譜 AI 已透過 ModelScope 和 Hugging Face 平台以寬鬆授權方式開源了 GLM-4。模型權重可用於研究和商業用途,但某些較大變體可能需要批准才能進行極高規模的商業部署。

什麼是 GLM 架構?

GLM(通用語言模型)是一種具有雙向注意力的自迴歸架構,最初由智譜 AI 和清華大學研究人員提出。它結合了僅編碼器模型(如 BERT)在理解任務上的優勢和僅解碼器模型(如 GPT)在生成任務上的優勢。

有哪些模型大小可用?

GLM-4 提供多種大小:GLM-4-9B 適用於輕量級部署,GLM-4-130B 提供完整能力,以及量化變體(Int4、Int8)可在消費級 GPU 上進行高效推論。9B 變體經過量化後可在單張 RTX 4090 上運行。


延伸閱讀

TAG