Categories

研究

OpenManus-RL:LLM 代理的强化学习调校
AI

OpenManus-RL:LLM 代理的强化学习调校

OpenManus-RL 是一个位于强化学习与 LLM 代理系统交汇点的开源研究项目,由 Ulab-UIUC(伊利诺伊大学厄巴纳-香槟分校)与 MetaGPT 协作开发。该项目提供一个全面的框架,用于 LLM 基础代理的强化学习调校,实现了 GRPO(群组相对策略优化)、监督式微调 …

神经符号 AI 能耗降低 100 倍
AI 趋势

神经符号 AI 能耗降低 100 倍

AI 产业在过去五年通过扩展规模来获取更强大的模型——增加参数、消耗更多算力,以令电网运营商从弗吉尼亚到新加坡都警觉的速度吞噬电力。2026 年 4 月,塔夫茨大学研究团队发布了一项成果,从根本挑战这一策略的核心假设:更大,不必然意味着更昂贵。他们的神经符号视觉语言动作模型在一项严苛的规划 …

TAG
CATEGORIES