"Higress 可以在不使用 AI 功能的情况下使用吗？"

"是的，Higress 同样是一个功能完整的云原生 API 网关，适用于传统工作负载。它支持标准 API 网关功能，包括路由、负载均衡、断路器、认证（OAuth2、JWT、OIDC）、速率限制、TLS 终止、金丝雀部署和 gRPC 代理。AI 功能是可选的附加功能。"

"如何开始使用 Higress？"

"Higress 可以通过 Helm 在 Kubernetes 上部署：`helm repo add higress.io https://higress.io/helm-charts` 和 `helm install higress -n higress-system higress.io/higress --create-namespace`。本地测试也支持 Docker Compose。配置可通过 Kubernetes CRD 或网页控制台进行。"

"哪些企业在生产环境中使用 Higress？"

"Higress 被阿里巴巴生态系统内外众多企业使用。它处理阿里云、淘宝和各种企业客户的生产流量。该网关已经在阿里巴巴规模下经过实战考验，每天处理数十亿次 API 调用，横跨数千个服务。"

开源

Higress：阿里巴巴基于 Istio 和 Envoy 的云原生 AI 网关

Q: "什么是 Higress？"

"Higress 是阿里巴巴开发的云原生 AI 网关，基于 Istio 和 Envoy 构建。它提供企业级的 API 管理，并具备原生 AI 功能，包括多模型 LLM 代理、基于 Token 的速率限制、AI 响应的语义缓存、MCP 服务器托管和 AI 特定的可观测性。"

Q: "Higress 提供哪些 AI 特定功能？"

"Higress 提供 AI 特定功能，包括：多模型 LLM 代理（将请求路由到不同模型）、基于 Token 的速率限制（按 API 密钥控制成本）、语义 AI 缓存（缓存和重用 LLM 响应）、MCP 服务器托管（通过模型上下文协议暴露工具）、提示工程（提示模板和转换），以及 AI 特定的指标和日志。"

Higress 是阿里巴巴的云原生 AI 网关，支持多模型 LLM 代理、Token 速率限制、AI 缓存和 MCP 服务器托管。

Keeping this site alive takes effort — your support means everything.

無程式碼也能輕鬆打造專業LINE官方帳號！一鍵導入模板，讓AI助你行銷加分！

技术编辑团队 May 04, 2026 阅读 6 分钟

随着 AI 应用从原型走向生产，管理 LLM API 流量的基础设施层变得至关重要。组织需要将请求路由到正确的模型、以 Token 级别的速率限制控制成本、智能地缓存响应，以及跨团队和应用监控使用情况。Higress 作为一个基于经过实战考验的 Istio 和 Envoy 基础构建的云原生 AI 网关，应对了所有这些需求。

由阿里巴巴开发的 Higress 将传统 API 网关概念扩展，加入原生 AI 能力。它理解 LLM 请求语义——Token、模型、流式响应和提示结构——实现了远远超越通用 API 网关所能提供的智能流量管理。

该网关的 Istio 基础架构意味着它可以无缝集成到 Kubernetes 环境中，支持服务网格部署模式、声明式配置和 GitOps 工作流程。对于已经在使用 Istio 的组织，Higress 可以嵌入现有基础设施，无需架构变更。

Higress 提供哪些 AI 特定功能？

Higress 的 AI 功能使其与传统 API 网关区别开来，提供专为 LLM 应用设计的能力。

graph TD
    A[客户端应用程序] --> B[Higress AI 网关]
    B --> C[多模型 LLM 代理]
    B --> D[Token 速率限制]
    B --> E[语义 AI 缓存]
    B --> F[MCP 服务器托管]
    B --> G[提示管理]
    C --> H[OpenAI API]
    C --> I[Anthropic API]
    C --> J[自行托管模型]
    C --> K[模型备用链]
    E --> L[语义缓存存储]
    F --> M[MCP 工具]

AI 功能	用途	效益
多模型 LLM 代理	将 API 调用路由到不同模型	供应商灵活性、故障转移
基于 Token 的速率限制	按密钥控制 API 支出	成本治理
语义 AI 缓存	自动缓存相似的提示	降低成本 40-60%
MCP 服务器托管	通过模型上下文协议托管工具	统一的工具访问
提示工程	模板和转换	一致的提示
AI 可观测性	Token 计数、延迟、成本	使用情况可见性

Higress 与其他 API 网关相比如何？

功能	Higress	Kong	APISIX	Envoy（独立）	AWS API Gateway
AI 多模型代理	原生	插件	插件	手动配置	有限
Token 速率限制	内置	自定义	自定义	自定义	无
语义缓存	内置	无	无	无	无
MCP 服务器	原生	无	无	无	无
Istio 集成	原生	插件	插件	原生	不适用

Higress 支持哪些传统 API 网关功能？

功能类别	能力
流量管理	负载均衡、断路器、重试、超时、速率限制
安全	JWT 验证、OAuth2/OIDC、HMAC、基本认证、WAF 集成
可观测性	Prometheus 指标、访问日志、追踪（OpenTelemetry）、仪表板
协议支持	HTTP/1.1、HTTP/2、gRPC、WebSocket、Dubbo
部署	金丝雀、蓝绿、A/B 测试、加权路由
性能	亚毫秒代理延迟、配置热重载

常见问题

什么是 Higress？ 基于 Istio 和 Envoy 的云原生 AI 网关，具备原生 AI 功能。

AI 特定功能？ 多模型 LLM 代理、Token 速率限制、语义 AI 缓存、MCP 服务器托管、提示工程和 AI 可观测性。

可不用 AI 功能吗？ 是的，也是一个功能完整的传统 API 网关，AI 功能可选。

如何开始？ Helm 部署在 Kubernetes 上，或 Docker Compose 本地测试。

哪些企业使用？ 阿里云、淘宝等，每天处理数十亿次 API 调用。

Higress：阿里巴巴基于 Istio 和 Envoy 的云原生 AI 网关

Higress 提供哪些 AI 特定功能？

Higress 与其他 API 网关相比如何？

Higress 支持哪些传统 API 网关功能？

常见问题

延伸阅读

LATEST POST

马斯克、库克与芬克预计本周随特朗普访中代表团赴北京

佛州大学毕业典礼演讲者遭嘘声凸显世代价值观断层与言论风险

Workday、Anthropic 与 LISC 联手推出 AI 一人创业加速器

TAG

CATEGORIES

Higress：阿里巴巴基于 Istio 和 Envoy 的云原生 AI 网关

Higress 提供哪些 AI 特定功能？

Higress 与其他 API 网关相比如何？

Higress 支持哪些传统 API 网关功能？

常见问题

延伸阅读

LATEST POST

马斯克、库克与芬克预计本周随特朗普访中代表团赴北京

佛州大学毕业典礼演讲者遭嘘声 凸显世代价值观断层与言论风险

Workday、Anthropic 与 LISC 联手推出 AI 一人创业加速器

TAG

CATEGORIES

佛州大学毕业典礼演讲者遭嘘声凸显世代价值观断层与言论风险