LLM

AI May 05, 2026

VeRL：字節跳動的 LLM 強化學習框架

2025-2026 年大型語言模型研究中最令人興奮的前沿並不是讓模型變得更大。而是透過強化學習讓它們變得更聰明。DeepSeek-R1 證明了 RL 訓練——特別是 GRPO（群組相對策略最佳化）——可以顯著提升模型的推理能力，實現與更大模型相匹敵的鏈式思考推理、自我修正和結構化問題解決。 …

開源 May 05, 2026

LLM 驅動聊天介面的興起造成了一個獨特的使用者體驗問題：看著文字逐字元出現令人興奮，但看著部分渲染的 Markdown 閃爍和跳動卻令人沮喪。當 LLM 生成程式碼區塊、表格或巢狀清單時，標準的 Markdown 渲染器無法處理 Token 的增量到達。它們等待完整的輸出，然後一次性渲染 …

AI May 05, 2026

傳統的網頁爬蟲依賴於脆弱的 CSS 選擇器和 XPath 表達式，只要網站更新標記就會失效。LLM Scraper 採取了根本不同的方法：它使用大型語言模型語義化理解頁面內容，並精確提取你所需的結構化 JSON 資料。這款由 mishushakov 建構的開源工具，填補了非結構化 …

AI May 05, 2026

現代 AI 聊天介面是工程的奇蹟，但其複雜性可能掩蓋了使它們運作的基本機制。nanoChat（GitHub 上的 karpathy/nanochat）是 Andrej Karpathy 刻意進行的極簡主義練習——一個足夠簡單讓開發人員可以在一次閱讀中讀懂並理解的 LLM 聊天介面。

AI May 05, 2026

提示工程已經從一門藝術發展為一門學科，但大多數從業者仍然將提示寫成非結構化的自然語言，依賴直覺而非方法論。LangGPT（GitHub 上的 langgptai/LangGPT）為提示設計帶來了結構、可重複性和工程嚴謹性，提供了一個用於建立、管理和評估 LLM 提示的全面框架。

AI May 05, 2026

The vision of a computer you can simply talk to has driven decades of research in natural language interfaces. Early attempts — from …