Bitsandbytes

AI May 04, 2026

bitsandbytes：LLM 訓練與推論必備的 k-bit 量化函式庫

大型語言模型已經遠遠超出了消費級硬體的記憶體容量。一個 700 億參數的模型在標準 16 位元精度下需要 140 GB 的 GPU 記憶體──遠遠超過最昂貴的消費級 GPU。bitsandbytes 就是彌補這個差距的函式庫，提供量化技術，使得在可負擔的硬體上載入、訓練和執行大型模型成為可 …