AI

DeerFlow:字節跳動的開源 LLM 工作流程引擎

DeerFlow 由字節跳動開發,是一個用於建構和編排 LLM 應用程式的工作流程引擎,具備視覺化管線設計和多模型支援。

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
DeerFlow:字節跳動的開源 LLM 工作流程引擎

建構生產級 LLM 應用程式遠不止單一的 API 呼叫。真實世界的應用程式將多個 LLM 呼叫鏈接在一起,結合資料處理步驟,應用條件邏輯,優雅地處理錯誤,並在整個管線中管理狀態。DeerFlow 由字節跳動開發,提供了一個全面的工作流程引擎,用於建構這類複雜的 LLM 應用程式,並配備視覺化管線設計器,使開發過程易於理解和透明。

DeerFlow 建立在一個觀察之上:大多數 LLM 應用程式遵循可識別的模式──檢索然後生成(RAG)、多步驟推理、LLM 作為評判者評估、以及基於代理的工具使用。DeerFlow 不是每次都從頭實作這些模式,而是提供可重複使用的管線元件,可以以視覺化和程式化方式連接在一起。

該平台反映了字節跳動在大規模 AI 部署方面的深厚經驗──該公司執行著世界上最大的推薦系統和內容生成管線。DeerFlow 將這些生產工程專業知識帶給了更廣泛的開發社群,提供了經過實戰考驗的可靠性、可擴展性和可觀測性模式。


DeerFlow 的管線架構如何運作?

DeerFlow 的架構建立在一個有向無環圖(DAG)執行模型之上,其中每個節點代表一個處理步驟,邊線定義資料流。

graph LR
    A[輸入] --> B[查詢路由器]
    B --> C{任務類型}
    C -->|RAG| D[檢索節點]
    C -->|生成| E[LLM 呼叫節點]
    C -->|分析| F[分析節點]
    D --> G[上下文建構器]
    G --> H[LLM 生成節點]
    E --> I[輸出格式化器]
    F --> I
    H --> I
    I --> J[最終輸出]
    I --> K[品質檢查節點]
    K -->|通過| J
    K -->|失敗| H

管線可以包括分支(多個節點的並行執行)、迴圈(迭代優化)、條件路由(基於中間結果的不同路徑)和子管線(在管線內組合管線)。


DeerFlow 提供哪些管線元件?

DeerFlow 內建一個豐富的預建節點庫,涵蓋 LLM 應用程式模式的完整範圍。

節點類型用途配置選項
LLM 呼叫進行 LLM API 呼叫模型、提示詞、溫度、最大 token 數
文字分割器將文字分割成區塊區塊大小、重疊、策略
嵌入生成文字嵌入模型、批次大小
向量搜尋在向量資料庫中進行語義搜尋集合、top-k、相似度指標
HTTP 請求呼叫外部 APIURL、方法、標頭、正文
程式碼執行器執行自訂程式碼語言、程式碼、超時
條件根據條件分支條件表達式、分支
聚合器合併多個輸入合併策略、格式
輸出驗證器驗證 LLM 輸出驗證規則、重試邏輯
記憶體儲存和檢索狀態儲存後端、TTL

節點可以使用自訂 Python 程式碼擴展,使得該平台適用於需要領域特定邏輯搭配 LLM 編排的工作流程。


DeerFlow 如何處理多模型編排?

DeerFlow 的優勢之一是能夠在單一管線內編排多個模型,為每個子任務選擇正確的模型。

編排模式描述優點
模型路由將子任務路由到最佳模型成本節省、品質最佳化
串聯先嘗試便宜的模型,再升級延遲/成本最佳化
整合查詢多個模型,匯總結果穩健性、準確性
評判-評估一個模型評估另一個模型品質控制
推測性快速模型草稿,慢速模型優化延遲改善
跨模型 RAG用一個模型嵌入,用另一個模型生成專門化最佳化

一個典型的成本最佳化管線可能使用一個小型、快速的模型進行初始處理,將複雜推理路由到更大的模型,並使用評估模型在回傳結果前驗證品質。


DeerFlow 包含哪些生產功能?

DeerFlow 從底層設計為生產部署,其功能解決了大規模運作 LLM 應用程式的常見挑戰。

功能實作使用案例
請求佇列基於優先級的訊息佇列處理流量高峰
速率限制按使用者、模型、管線成本控制
語義快取基於嵌入的快取查找延遲降低
重試邏輯具有抖動的指數退避處理暫時性故障
備援模型自動模型故障轉移高可用性
追蹤OpenTelemetry 整合除錯和最佳化
版本控制管線版本管理安全部署
A/B 測試按百分比進行管線路由逐步推出

監控儀表板提供管線效能的即時可視性,包括延遲分佈、錯誤率、token 使用量和每次管線執行成本。


FAQ

什麼是 DeerFlow? DeerFlow 是字節跳動的開源工作流程引擎,用於建構和編排 LLM 應用程式。它提供視覺化管線設計介面、多模型支援和生產級編排能力。

DeerFlow 的視覺化管線設計器如何運作? 視覺化設計器使用拖放節點編輯器,您可以將 LLM 呼叫、資料轉換、條件邏輯和外部 API 呼叫連接成可執行的管線。每個節點可以配置提示詞、模型和參數。

DeerFlow 支援哪些 LLM? DeerFlow 支援多個 LLM 提供者,包括字節跳動自家的模型、OpenAI、Anthropic、Google Gemini,以及透過 Ollama 和 vLLM 整合的開源模型。

DeerFlow 能處理生產工作負載嗎? 是的,DeerFlow 包含生產功能,如請求佇列、速率限制、快取、帶重試的錯誤處理、日誌記錄和監控。它可以部署為可擴展的服務。

DeerFlow 與其他 LLM 編排工具相比如何? DeerFlow 以其視覺化管線設計器、字節跳動模型生態系統整合以及針對高吞吐量、低延遲生產部署場景的最佳化而與眾不同。


延伸閱讀

TAG