OpenHands 是一个开源 AI 驱动的软件开发平台,迅速成长至超过 71,000 个 GitHub 星星,重新定义了 AI 辅助编码的可能性。前身为 OpenDevin,OpenHands 由 All-Hands-AI 开发,提供一个全面环境,让 AI 代理可以自主编写代码、调试、部署应用程序、浏览网页,并与人类开发者实时协作。
该平台的与众不同之处在于它在沙箱化执行环境中运行,赋予 AI 代理完整的 bash shell、浏览器与代码编辑器访问权限——就像人类开发者的工作站。这种以环境为先的设计让 OpenHands 能够处理复杂的多步骤软件工程任务,远远超越简单的代码补全,使其成为 2026 年最有能力的开源编码代理之一。
什么是 OpenHands?它如何运作?
OpenHands 是一个 AI 软件开发平台,让 LLM 驱动的代理在安全的沙箱化环境中运作。代理接收任务、规划方法、在终端中执行命令、编辑文件、运行测试,并反复迭代直到任务完成。该平台支持多种 LLM 后端,包括 GPT-4、Claude 与开源模型,并提供网页界面实时监控代理进度。
OpenHands 组件
| 组件 | 说明 | 技术 |
|---|---|---|
| 代理运行时 | 沙箱化执行环境 | Docker, MicroK8s |
| 代码编辑器 | 内置文件编辑界面 | Monaco Editor |
| 浏览器 | 无头浏览器用于网页任务 | Playwright |
| Bash Shell | 完整终端访问 | Docker 容器 |
| 规划器 | 任务分解与规划 | LLM 引导 |
| 网页 UI | 实时代理监控 | Next.js, React |
SWE-Bench 表现
OpenHands 持续名列 SWE-Bench 顶尖系统,SWE-Bench 是评估 AI 编码代理处理真实 GitHub 问题的行业标准基准。
| 评估 | 分数 | 日期 | 备注 |
|---|---|---|---|
| SWE-Bench Verified | 48.6% 已解决 | 2025 Q3 | 开源 SOTA |
| SWE-Bench Lite | 42.3% 已解决 | 2025 Q3 | 完整 SWE-Bench Lite |
| SWE-Bench Full | 33.8% 已解决 | 2025 Q3 | 2,294 个真实问题 |
| HumanEval | 92.1% pass@1 | 2025 Q3 | Python 代码生成 |
代理架构如何运作?
OpenHands 使用模块化代理架构。核心代理是一个事件驱动的循环,处理来自环境的观察结果(终端输出、文件内容、浏览器状态)并决定下一个动作(编写代码、执行命令、浏览网页)。动作与观察结果存储在结构化历史记录中,代理可参考以获取上下文。代理还可以产生子代理进行并行任务执行。
flowchart TD
A[用户任务] --> B[代理控制器]
B --> C[任务规划器]
C --> D{代理循环}
D --> E[观察环境]
E --> F[LLM 推理]
F --> G[选择动作]
G --> H{Bash 命令?}
G --> I{编辑文件?}
G --> J{浏览网页?}
H --> K[在沙箱中执行]
I --> L[写入文件系统]
J --> M[无头浏览器]
K --> E
L --> E
M --> E
D --> N[任务完成]
N --> O[提交结果]支持哪些 LLM?
| 提供商 | 模型 | 品质等级 |
|---|---|---|
| OpenAI | GPT-4o, GPT-4o-mini, o1, o3 | 优秀 |
| Anthropic | Claude 3.5 Sonnet, Claude 4 | 优秀 |
| Gemini 1.5 Pro, 2.0 Flash | 非常好 | |
| 开源 | DeepSeek V3, Qwen 3, LLaMA 4 | 非常好 |
| 本地 | Ollama, vLLM, LM Studio | 良好(上下文有限) |
OpenHands 如何处理软件部署?
OpenHands 包含一个部署管线,可以将应用程序推送到云平台、配置 CI/CD 工作流,并以代码形式管理基础设施。代理可以创建 Dockerfile、编写部署脚本、配置 Nginx 或 Caddy、设置 SSL 证书,并部署到 Vercel、Netlify、AWS 或任何通过 SSH 访问的 Linux 服务器。这种端到端能力意味着 OpenHands 可以将项目从空目录带到在线部署,无需人类干预。
OpenHands 提供哪些企业功能?
对于企业部署,OpenHands 提供多代理协调(含角色基础任务分配)、REST API 以便集成到现有开发工作流、自定义沙箱配置以满足安全合规、长期项目的持久性工作区,以及所有代理动作的审计日志。该项目还支持无头模式进行服务器端部署,适合集成到 CI/CD 管线中。
sequenceDiagram
participant Dev as 开发者
participant OH as OpenHands
participant Sandbox as 沙箱
participant LLM as LLM 后端
participant Git as GitHub
Dev->>OH: "修复 PR #42 中的这个错误"
OH->>Git: 克隆仓库
OH->>LLM: 分析问题描述
LLM-->>OH: 对错误的理解
OH->>Sandbox: 运行测试以重现
Sandbox-->>OH: 测试失败输出
OH->>LLM: 提出修复策略
LLM-->>OH: 修复计划
OH->>Sandbox: 编辑源文件
OH->>Sandbox: 再次运行测试
Sandbox-->>OH: 所有测试通过
OH->>Git: 提交并推送修复
OH-->>Dev: "错误已修复,PR 已更新"常见问题
什么是 OpenHands? OpenHands 是一个开源 AI 驱动的软件开发平台,AI 代理在沙箱化环境中自主编写代码、调试、部署并与人类开发者协作。
它的 SWE-Bench 分数是多少? OpenHands 在 SWE-Bench Verified 上达到 48.6%,是处理真实软件工程任务表现最佳的开源编码代理之一。
OpenHands 包含哪些组件? 该平台提供 bash shell、代码编辑器、无头浏览器、任务规划器与实时网页 UI——全部在安全的 Docker 沙箱中运行。
OpenHands 支持哪些 LLM? OpenAI GPT-4o、Anthropic Claude、Google Gemini、DeepSeek、Qwen,以及通过 Ollama、vLLM 或 LM Studio 的本地模型。
有哪些企业功能可用? 多代理协调、REST API、自定义沙箱、持久性工作区、审计日志以及无头 CI/CD 集成。
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!