开源

Higress:阿里巴巴基于 Istio 和 Envoy 的云原生 AI 网关

Higress 是阿里巴巴的云原生 AI 网关,支持多模型 LLM 代理、Token 速率限制、AI 缓存和 MCP 服务器托管。

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
Higress:阿里巴巴基于 Istio 和 Envoy 的云原生 AI 网关

随着 AI 应用从原型走向生产,管理 LLM API 流量的基础设施层变得至关重要。组织需要将请求路由到正确的模型、以 Token 级别的速率限制控制成本、智能地缓存响应,以及跨团队和应用监控使用情况。Higress 作为一个基于经过实战考验的 Istio 和 Envoy 基础构建的云原生 AI 网关,应对了所有这些需求。

由阿里巴巴开发的 Higress 将传统 API 网关概念扩展,加入原生 AI 能力。它理解 LLM 请求语义——Token、模型、流式响应和提示结构——实现了远远超越通用 API 网关所能提供的智能流量管理。

该网关的 Istio 基础架构意味着它可以无缝集成到 Kubernetes 环境中,支持服务网格部署模式、声明式配置和 GitOps 工作流程。对于已经在使用 Istio 的组织,Higress 可以嵌入现有基础设施,无需架构变更。


Higress 提供哪些 AI 特定功能?

Higress 的 AI 功能使其与传统 API 网关区别开来,提供专为 LLM 应用设计的能力。

graph TD
    A[客户端应用程序] --> B[Higress AI 网关]
    B --> C[多模型 LLM 代理]
    B --> D[Token 速率限制]
    B --> E[语义 AI 缓存]
    B --> F[MCP 服务器托管]
    B --> G[提示管理]
    C --> H[OpenAI API]
    C --> I[Anthropic API]
    C --> J[自行托管模型]
    C --> K[模型备用链]
    E --> L[语义缓存存储]
    F --> M[MCP 工具]
AI 功能用途效益
多模型 LLM 代理将 API 调用路由到不同模型供应商灵活性、故障转移
基于 Token 的速率限制按密钥控制 API 支出成本治理
语义 AI 缓存自动缓存相似的提示降低成本 40-60%
MCP 服务器托管通过模型上下文协议托管工具统一的工具访问
提示工程模板和转换一致的提示
AI 可观测性Token 计数、延迟、成本使用情况可见性

Higress 与其他 API 网关相比如何?

功能HigressKongAPISIXEnvoy(独立)AWS API Gateway
AI 多模型代理原生插件插件手动配置有限
Token 速率限制内置自定义自定义自定义
语义缓存内置
MCP 服务器原生
Istio 集成原生插件插件原生不适用

Higress 支持哪些传统 API 网关功能?

功能类别能力
流量管理负载均衡、断路器、重试、超时、速率限制
安全JWT 验证、OAuth2/OIDC、HMAC、基本认证、WAF 集成
可观测性Prometheus 指标、访问日志、追踪(OpenTelemetry)、仪表板
协议支持HTTP/1.1、HTTP/2、gRPC、WebSocket、Dubbo
部署金丝雀、蓝绿、A/B 测试、加权路由
性能亚毫秒代理延迟、配置热重载

常见问题

什么是 Higress? 基于 Istio 和 Envoy 的云原生 AI 网关,具备原生 AI 功能。

AI 特定功能? 多模型 LLM 代理、Token 速率限制、语义 AI 缓存、MCP 服务器托管、提示工程和 AI 可观测性。

可不用 AI 功能吗? 是的,也是一个功能完整的传统 API 网关,AI 功能可选。

如何开始? Helm 部署在 Kubernetes 上,或 Docker Compose 本地测试。

哪些企业使用? 阿里云、淘宝等,每天处理数十亿次 API 调用。


延伸阅读

TAG
CATEGORIES