Tags

Verifiers

Verifiers:用于训练 LLM 代理的模块化 RL 环境库
AI

Verifiers:用于训练 LLM 代理的模块化 RL 环境库

Verifiers 是由 PrimeIntellect-ai 开发的模块化 Python 库,提供一个全面框架,用于创建专为训练 LLM 代理而设计的强化学习环境。专为从事基于 RL 的 LLM 对齐与代理优化的研究人员与实务工作者设计,Verifiers 提供一个干净、可组合的 API, …

TAG
CATEGORIES