ComfyUI 生態系統已成長為最豐富的 AI 影像生成平台之一,而該生態系統的核心正是 Fannovel16 開發的 ComfyUI ControlNet Aux。這個開源擴充功能提供了超過 30 個預處理節點,用於提取 ControlNet 模型引導 AI 影像生成所需的提示影像。
ControlNet 透過引入空間控制機制從根本上改變了 AI 藝術——讓藝術家精確定義物體出現的位置、姿勢如何映射以及視覺風格的呈現。但 ControlNet 不能與原始影像直接配合使用。它需要預處理過的「提示影像」——邊緣圖、深度圖、姿態骨架、分割疊加層——這些以模型能理解的格式編碼空間資訊。這就是 ControlNet Aux 的用武之地。
該擴充功能已成為全球 ComfyUI 使用者不可或缺的工具,服務於從追求精確姿勢控制的角色藝術家到在多個視角生成一致建築渲染的建築設計師。其預處理器集合涵蓋了幾乎所有活躍使用的 ControlNet 模型,而 v2 遷移帶來了顯著的效能提升與統一的節點輸出,以實現更好的工作流程互通性。
graph TD
A[輸入影像] --> B[ControlNet Aux 預處理器]
B --> C{預處理器類型}
C -->|線條| D[Canny / HED / SoftEdge]
C -->|深度| E[Depth Anything / Zoe / MiDaS]
C -->|姿態| F[OpenPose / DWPose / Face]
C -->|分割| G[SAM / OneFormer / Uniformer]
D --> H[線條提示影像]
E --> I[深度提示影像]
F --> J[骨架提示影像]
G --> K[分割提示影像]
H --> L[ControlNet 模型]
I --> L
J --> L
K --> L
L --> M[引導式影像生成]有哪些預處理器類別可用?
ControlNet Aux 將其 30 多種預處理器分為功能類別,每個類別在生成管線中服務不同的控制目的。
| 類別 | 預處理器 | 最佳用途 | ControlNet 模型 |
|---|---|---|---|
| 線條/邊緣 | Canny、HED、SoftEdge、MLSD、Scribble、LineArt、AnimeLineArt | 構圖、輪廓、建築圖 | ControlNet-Canny、ControlNet-MLSD |
| 深度 | Depth Anything v2、Zoe Depth、MiDaS、LeReS、DPT | 3D 一致場景、多視角生成 | ControlNet-Depth、ControlNet-Zoe |
| 姿態/骨架 | OpenPose、DWPose、臉部特徵點、手部姿態 | 角色擺姿勢、手勢控制、人物繪畫 | ControlNet-OpenPose |
| 分割 | SAM、OneFormer、Uniformer、BRS_Inference | 基於區域的生成、背景替換 | ControlNet-Seg(ADE20K) |
| 表面法線 | NormalBae、NNET | 材質渲染、表面細節保留 | ControlNet-Normal |
| 草圖 | Scribble、PIDiNet | 快速草圖、粗略方向輸入 | ControlNet-Scribble |
預處理器的選擇直接影響您對生成影像的控制品質與類型。例如,Canny 邊緣檢測會產生清晰、高對比的線條圖,適用於建築渲染,但對於有機主體可能過於嚴格。相反地,深度預處理器在保持生成幀間一致透視的同時,給模型更多的空間自由度。
從舊版節點遷移至 v2 如何運作?
轉換至 ControlNet Aux v2 是一項重大的破壞性變更,影響了現有工作流程。理解遷移路徑對於任何維護 ComfyUI 環境的人來說至關重要。
flowchart LR
A[舊版 v1 節點] --> B{自動遷移}
B --> C[執行遷移工具]
C --> D[轉換節點參照]
D --> E[v2 相容工作流程]
E --> F{節點衝突?}
F -->|是| G[停用舊的自訂節點]
F -->|否| H[準備執行]
G --> H| 遷移面向 | 舊版(v1) | v2 | 影響 |
|---|---|---|---|
| 節點命名 | CannyPreprocessor | ControlNetPreprocessor | 工作流程 JSON 參照中斷 |
| 輸出格式 | 類別特定 | 統一張量 | 改善下游節點相容性 |
| 模型載入 | 每個節點載入模型 | 集中式模型快取 | 首次執行更快、磁碟佔用更小 |
| 自訂節點依賴 | 手動安裝 | 自動下載缺失模型 | 更自包含 |
新版本 ControlNet Aux 內建的遷移工具可以自動改寫工作流程 JSON 檔案以使用 v2 節點參照。如果您更新後在 ComfyUI 中看到紅色錯誤節點,執行遷移通常是第一個故障排除步驟。
驅動進階工作流程的關鍵功能有哪些?
除了基本預處理,ControlNet Aux 還包含多項支援複雜生成管線的進階功能。
| 功能 | 能力 | 範例用例 |
|---|---|---|
| 解析度無關的預處理 | 適用於任何輸入解析度 | 批次放大工作流程 |
| 預處理器堆疊 | 鏈結多個預處理器 | Canny + Depth 混合建築控制 |
| 模型自動下載 | 首次使用時下載模型 | 一鍵設定新預處理器 |
| 統一輸出張量 | 所有節點標準化輸出 | 無需重新連線即可切換預處理器 |
| 批次支援 | 高效處理多個影像 | 跨整個角色表進行風格轉換 |
這些功能使 ControlNet Aux 成為進階 ComfyUI 管線的骨幹,從 AI 角色一致性工作流程 到建築視覺化套件與動畫幀插值系統。
如何安裝與配置 ControlNet Aux?
安裝可以透過 ComfyUI Manager 或直接複製倉庫完成。
方法 1 – ComfyUI Manager(建議)
- 從主介面開啟 ComfyUI Manager
- 搜尋「ControlNet Aux」
- 點擊安裝並重新啟動 ComfyUI
方法 2 – 手動安裝
cd ComfyUI/custom_nodes/
git clone https://github.com/Fannovel16/comfyui_controlnet_aux
pip install -r requirements.txt
安裝後,重新啟動 ComfyUI。新的預處理器節點會出現在節點選單的「ControlNet Preprocessor」類別下。某些預處理器需要在首次使用時下載模型,這會在後台自動進行。
FAQ
什麼是 ComfyUI ControlNet Aux? ComfyUI ControlNet Aux 是 Fannovel16 開發的開源擴充功能,為 ComfyUI 新增 30 多個預處理節點,可提取線稿、深度圖、姿態骨架與分割遮罩等 ControlNet 提示影像,用於受控的 AI 影像生成。
支援哪些預處理器類別? 支援線條提取(Canny、HED、SoftEdge、MLSD)、深度映射(Depth Anything v2、Zoe Depth、MiDaS)、姿態估計(OpenPose、DWPose、臉部特徵點)、分割(SAM、OneFormer、Uniformer),以及法線貼圖與 AnimeLineArt 等專門處理器。
線條、深度與姿態預處理器有何不同? 線條預處理器提取結構輪廓用於構圖控制。深度預處理器生成灰階深度圖以確保場景間的空間一致性。姿態預處理器產生骨架疊加層用於引導人物定位,可在生成的影像中精確控制解剖結構。
如何安裝 ComfyUI ControlNet Aux? 透過 ComfyUI Manager 搜尋「ControlNet Aux」並點擊安裝。或者直接將倉庫複製到 ComfyUI 的 custom_nodes 目錄:‘git clone https://github.com/Fannovel16/comfyui_controlnet_aux' 並重新啟動 ComfyUI。
遷移至 ControlNet Aux v2 是否會破壞現有工作流程? 從舊版節點遷移至 ControlNet Aux v2 改變了節點命名慣例與內部 API。內建的遷移工具可將您舊的工作流程轉換為 v2 版本。遷移後,請清除或停用舊的舊版自訂節點以防止節點衝突。
延伸閱讀
- ComfyUI ControlNet Aux GitHub 倉庫 – 原始碼、問題與使用範例
- ControlNet 官方論文 – 原始研究,介紹擴散模型的空間條件控制
- ComfyUI Manager – 管理自訂節點安裝的推薦工具
- Depth Anything v2 論文 – 用於預處理器的先進單眼深度估計
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!