QLoRA

AI May 05, 2026

Unsloth：2 倍速 LLM 微調，記憶體用量減半

Fine-tuning large language models on consumer hardware has been a game of memory optimization Tetris. Every byte of GPU memory is precious — …

AI May 05, 2026

微調大型語言模型曾經是一個複雜、資源密集的過程，僅限於擁有大型 GPU 叢集的組織。LlamaFactory 使這項能力普及化，提供一個可存取的、功能豐富的框架，使在消費級硬體上微調數百種 LLM 架構變得實用。由研究社群（hiyouga/LlamaFactory）創建，該框架已成長為最 …

AI May 04, 2026

大型語言模型已經遠遠超出了消費級硬體的記憶體容量。一個 700 億參數的模型在標準 16 位元精度下需要 140 GB 的 GPU 記憶體──遠遠超過最昂貴的消費級 GPU。bitsandbytes 就是彌補這個差距的函式庫，提供量化技術，使得在可負擔的硬體上載入、訓練和執行大型模型成為可 …