OpenManus-RL:LLM 代理的强化学习调校
OpenManus-RL 是一个位于强化学习与 LLM 代理系统交汇点的开源研究项目,由 Ulab-UIUC(伊利诺伊大学厄巴纳-香槟分校)与 MetaGPT 协作开发。该项目提供一个全面的框架,用于 LLM 基础代理的强化学习调校,实现了 GRPO(群组相对策略优化)、监督式微调 …
OpenManus-RL 是一个位于强化学习与 LLM 代理系统交汇点的开源研究项目,由 Ulab-UIUC(伊利诺伊大学厄巴纳-香槟分校)与 MetaGPT 协作开发。该项目提供一个全面的框架,用于 LLM 基础代理的强化学习调校,实现了 GRPO(群组相对策略优化)、监督式微调 …
使用 AI 代理进行软件开发的概念并不新鲜,但 MetaGPT 将它推向了前所未有的高度。它不是部署单一 AI 来编写代码,而是创建了一个完全由 AI 代理组成的模拟软件公司——每个代理都有特定的角色、专业知识与责任。 由 FoundationAgents 开发,MetaGPT 已在 …