OpenManus-RL:LLM 代理的強化學習調校
OpenManus-RL 是一個位於強化學習與 LLM 代理系統交會點的開源研究專案,由 Ulab-UIUC(伊利諾大學香檳分校)與 MetaGPT 協作開發。該專案提供一個全面的框架,用於 LLM 基礎代理的強化學習調校,實作了 GRPO(群組相對策略最佳化)、監督式微調 (SFT) 以 …
OpenManus-RL 是一個位於強化學習與 LLM 代理系統交會點的開源研究專案,由 Ulab-UIUC(伊利諾大學香檳分校)與 MetaGPT 協作開發。該專案提供一個全面的框架,用於 LLM 基礎代理的強化學習調校,實作了 GRPO(群組相對策略最佳化)、監督式微調 (SFT) 以 …
使用 AI 代理進行軟體開發的概念並不新鮮,但 MetaGPT 將它推向了前所未有的高度。它不是部署單一 AI 來撰寫程式碼,而是創建了一個完全由 AI 代理組成的模擬軟體公司——每個代理都有特定的角色、專業知識與責任。 由 FoundationAgents 開發,MetaGPT 已在 …