Categories

AI

VeRL:字节跳动的 LLM 强化学习框架
AI

VeRL:字节跳动的 LLM 强化学习框架

2025-2026 年大型语言模型研究中最令人兴奋的前沿并不是让模型变得更大。而是通过强化学习让它们变得更聪明。DeepSeek-R1 证明了 RL 训练——特别是 GRPO(群组相对策略优化)——可以显著提升模型的推理能力,实现与更大模型相匹敌的链式思考推理、自我修正和结构化问题解决。字 …

Twinny:VS Code 的本地 LLM 推理
AI

Twinny:VS Code 的本地 LLM 推理

云依赖的 AI 工具与开发者隐私之间的矛盾已成为 AI 辅助软件开发中最具决定性的辩论之一。GitHub Copilot 和 Cursor 等服务提供了令人印象深刻的代码补全功能,但它们需要将你的代码发送到外部服务器。对于处理专有代码、在受监管行业工作或只是不愿与云服务分享工作成果的开发者 …

Pezzo:开源 LLM 运营平台
AI

Pezzo:开源 LLM 运营平台

在生产环境中管理 LLM 驱动的应用程序已成为 AI 工程中最具挑战性的运营问题之一。部署 AI 功能的团队面临一系列问题:提示词版本散落在代码库和笔记本中,成本在没有可见性的情况下失控,性能下降直到用户投诉才被发现,以及模型更新破坏了精心调整的提示词。LLMOps 这门学科正是为应对这些 …

LLM Graph Builder:Neo4j 的 RAG 到图谱管线
AI

LLM Graph Builder:Neo4j 的 RAG 到图谱管线

传统检索增强生成(RAG)的局限性随着组织将 AI 系统部署到生产环境而变得越来越明显。向量搜索——传统 RAG 的骨干——在寻找语义相似的文档块方面做得不错,但它从根本上缺乏结构理解。它无法表达「Apple 在 2014 年收购了 Beats」涉及两个具有特定类型和日期的实体之间的关系。 …

GLM-4.5:智谱 AI 的次世代多模态基础模型
AI

GLM-4.5:智谱 AI 的次世代多模态基础模型

2025-2026 年基础模型的演进由两个趋势定义:多模态化和效率。只能处理文本的模型已迅速让位给原生理解图像、音频和视频的模型。同时,专家混合(MoE)架构已成为构建既强大又实用千部署的模型的标准方法。智谱 AI 的 GLM-4.5 代表了这些趋势在中文 AI 生态系统中的汇聚。

GLM-4:智谱 AI 的开源双语 LLM
AI

GLM-4:智谱 AI 的开源双语 LLM

大型语言模型的格局长期以来以英文优先发展为主。OpenAI、Anthropic、Google、Meta 和 Mistral 都以其旗舰模型以英文为主要语言,通过翻译或混合训练数据将多语言能力作为事后补充。这为数十亿主要使用非英文与 AI 交互的用户带来了实际问题——尤其是中文,它代表了世界 …

TAG
CATEGORIES