Tags

LLM

VeRL:字節跳動的 LLM 強化學習框架
AI

VeRL:字節跳動的 LLM 強化學習框架

2025-2026 年大型語言模型研究中最令人興奮的前沿並不是讓模型變得更大。而是透過強化學習讓它們變得更聰明。DeepSeek-R1 證明了 RL 訓練——特別是 GRPO(群組相對策略最佳化)——可以顯著提升模型的推理能力,實現與更大模型相匹敵的鏈式思考推理、自我修正和結構化問題解決。 …

Streamdown:Vercel 的串流 Markdown 渲染器
開源

Streamdown:Vercel 的串流 Markdown 渲染器

LLM 驅動聊天介面的興起造成了一個獨特的使用者體驗問題:看著文字逐字元出現令人興奮,但看著部分渲染的 Markdown 閃爍和跳動卻令人沮喪。當 LLM 生成程式碼區塊、表格或巢狀清單時,標準的 Markdown 渲染器無法處理 Token 的增量到達。它們等待完整的輸出,然後一次性渲染 …

LLM Scraper:使用 LLM 從網頁中提取結構化資料
AI

LLM Scraper:使用 LLM 從網頁中提取結構化資料

傳統的網頁爬蟲依賴於脆弱的 CSS 選擇器和 XPath 表達式,只要網站更新標記就會失效。LLM Scraper 採取了根本不同的方法:它使用大型語言模型語義化理解頁面內容,並精確提取你所需的結構化 JSON 資料。 這款由 mishushakov 建構的開源工具,填補了非結構化 …

nanoChat:Karpathy 的極簡 LLM 聊天介面
AI

nanoChat:Karpathy 的極簡 LLM 聊天介面

現代 AI 聊天介面是工程的奇蹟,但其複雜性可能掩蓋了使它們運作的基本機制。nanoChat(GitHub 上的 karpathy/nanochat)是 Andrej Karpathy 刻意進行的極簡主義練習——一個足夠簡單讓開發人員可以在一次閱讀中讀懂並理解的 LLM 聊天介面。

LangGPT:結構化提示工程框架
AI

LangGPT:結構化提示工程框架

提示工程已經從一門藝術發展為一門學科,但大多數從業者仍然將提示寫成非結構化的自然語言,依賴直覺而非方法論。LangGPT(GitHub 上的 langgptai/LangGPT)為提示設計帶來了結構、可重複性和工程嚴謹性,提供了一個用於建立、管理和評估 LLM 提示的全面框架。

TAG