OpenHands 是一個開源 AI 驅動的軟體開發平台,迅速成長至超過 71,000 個 GitHub 星星,重新定義了 AI 輔助編碼的可能性。前身為 OpenDevin,OpenHands 由 All-Hands-AI 開發,提供一個全面環境,讓 AI 代理可以自主編寫程式碼、除錯、部署應用程式、瀏覽網頁,並與人類開發者即時協作。
該平台的與眾不同之處在於它在沙箱化執行環境中運行,賦予 AI 代理完整的 bash shell、瀏覽器與程式碼編輯器存取權限——就像人類開發者的工作站。這種以環境為先的設計讓 OpenHands 能夠處理複雜的多步驟軟體工程任務,遠遠超越簡單的程式碼補全,使其成為 2026 年最有能力的開源編碼代理之一。
什麼是 OpenHands?它如何運作?
OpenHands 是一個 AI 軟體開發平台,讓 LLM 驅動的代理在安全的沙箱化環境中運作。代理接收任務、規劃方法、在終端機中執行命令、編輯檔案、執行測試,並反覆迭代直到任務完成。該平台支援多種 LLM 後端,包括 GPT-4、Claude 與開源模型,並提供網頁介面即時監控代理進度。
OpenHands 元件
| 元件 | 說明 | 技術 |
|---|---|---|
| 代理執行環境 | 沙箱化執行環境 | Docker, MicroK8s |
| 程式碼編輯器 | 內建檔案編輯介面 | Monaco Editor |
| 瀏覽器 | 無頭瀏覽器用於網頁任務 | Playwright |
| Bash Shell | 完整終端機存取 | Docker 容器 |
| 規劃器 | 任務分解與規劃 | LLM 引導 |
| 網頁 UI | 即時代理監控 | Next.js, React |
SWE-Bench 表現
OpenHands 持續名列 SWE-Bench 頂尖系統,SWE-Bench 是評估 AI 編碼代理處理真實 GitHub 問題的行業標準基準。
| 評量 | 分數 | 日期 | 備註 |
|---|---|---|---|
| SWE-Bench Verified | 48.6% 已解決 | 2025 Q3 | 開源 SOTA |
| SWE-Bench Lite | 42.3% 已解決 | 2025 Q3 | 完整 SWE-Bench Lite |
| SWE-Bench Full | 33.8% 已解決 | 2025 Q3 | 2,294 個真實問題 |
| HumanEval | 92.1% pass@1 | 2025 Q3 | Python 程式碼生成 |
代理架構如何運作?
OpenHands 使用模組化代理架構。核心代理是一個事件驅動的迴圈,處理來自環境的觀察結果(終端機輸出、檔案內容、瀏覽器狀態)並決定下一個動作(編寫程式碼、執行命令、瀏覽網頁)。動作與觀察結果儲存在結構化歷史記錄中,代理可參考以獲取上下文。代理還可以產生子代理進行並行任務執行。
flowchart TD
A[使用者任務] --> B[代理控制器]
B --> C[任務規劃器]
C --> D{代理迴圈}
D --> E[觀察環境]
E --> F[LLM 推理]
F --> G[選擇動作]
G --> H{Bash 命令?}
G --> I{編輯檔案?}
G --> J{瀏覽網頁?}
H --> K[在沙箱中執行]
I --> L[寫入檔案系統]
J --> M[無頭瀏覽器]
K --> E
L --> E
M --> E
D --> N[任務完成]
N --> O[提交結果]支援哪些 LLM?
| 提供者 | 模型 | 品質等級 |
|---|---|---|
| OpenAI | GPT-4o, GPT-4o-mini, o1, o3 | 優秀 |
| Anthropic | Claude 3.5 Sonnet, Claude 4 | 優秀 |
| Gemini 1.5 Pro, 2.0 Flash | 非常好 | |
| 開源 | DeepSeek V3, Qwen 3, LLaMA 4 | 非常好 |
| 本地 | Ollama, vLLM, LM Studio | 良好(上下文有限) |
OpenHands 如何處理軟體部署?
OpenHands 包含一個部署管線,可以將應用程式推送到雲端平台、配置 CI/CD 工作流程,並以程式碼形式管理基礎設施。代理可以建立 Dockerfile、編寫部署腳本、配置 Nginx 或 Caddy、設定 SSL 憑證,並部署到 Vercel、Netlify、AWS 或任何透過 SSH 存取的 Linux 伺服器。這種端到端能力意味著 OpenHands 可以將專案從空目錄帶到線上部署,無需人類干預。
OpenHands 提供哪些企業功能?
對於企業部署,OpenHands 提供多代理協調(含角色基礎任務分配)、REST API 以便整合到現有開發工作流程、自訂沙箱配置以滿足安全合規、長期專案的持續性工作區,以及所有代理動作的稽核日誌。該專案還支援無頭模式進行伺服器端部署,適合整合到 CI/CD 管線中。
sequenceDiagram
participant Dev as 開發者
participant OH as OpenHands
participant Sandbox as 沙箱
participant LLM as LLM 後端
participant Git as GitHub
Dev->>OH: "修復 PR #42 中的這個錯誤"
OH->>Git: 複製倉庫
OH->>LLM: 分析問題描述
LLM-->>OH: 對錯誤的理解
OH->>Sandbox: 執行測試以重現
Sandbox-->>OH: 測試失敗輸出
OH->>LLM: 提出修復策略
LLM-->>OH: 修復計畫
OH->>Sandbox: 編輯原始檔
OH->>Sandbox: 再次執行測試
Sandbox-->>OH: 所有測試通過
OH->>Git: 提交並推送修復
OH-->>Dev: "錯誤已修復,PR 已更新"常見問題
什麼是 OpenHands? OpenHands 是一個開源 AI 驅動的軟體開發平台,AI 代理在沙箱化環境中自主編寫程式碼、除錯、部署並與人類開發者協作。
它的 SWE-Bench 分數是多少? OpenHands 在 SWE-Bench Verified 上達到 48.6%,是處理真實軟體工程任務表現最佳的開源編碼代理之一。
OpenHands 包含哪些元件? 該平台提供 bash shell、程式碼編輯器、無頭瀏覽器、任務規劃器與即時網頁 UI——全部在安全的 Docker 沙箱中運行。
OpenHands 支援哪些 LLM? OpenAI GPT-4o、Anthropic Claude、Google Gemini、DeepSeek、Qwen,以及透過 Ollama、vLLM 或 LM Studio 的本地模型。
有哪些企業功能可用? 多代理協調、REST API、自訂沙箱、持續性工作區、稽核日誌以及無頭 CI/CD 整合。
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!