ray.rllib-入门实践-13:自定义多智能体强化学习

ray.rllib-入门实践-13:自定义多智能体强化学习

        我在博客  中介绍了自定义 rllib 强化学习环境的方法与使用示例,但是那个示例是针对单智能体强化学习环境的。自定义多智能体强化学习环境及使用, 与单智能体方法步骤类似,单细节上有许多不同, 相对更复杂一些 。

        大概的三个步骤是: 

        1. 定义多智能体强化学习环境

        2. 向ray注册环境

        3. 配置并使用环境执行训练与评估。

环境配置:

        torch==2.5.1

        ray==2.10.0

        ray[rllib]==2.10.0

  Agent 智能体       ray[tune]==2.10.0

        ray[serve]==2.10.0

        numpy==1.23.0

        python==3.9.18

需要继承自 “ray.rllib.env.multi_agent_env.MultiAgentEnv”. reset 函数和step函数接口需要与下面保持严格一致。每一个输出都变成了 key:value 字典。


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/239270.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 上午9:39
下一篇 2026年3月16日 上午9:39


相关推荐

关注全栈程序员社区公众号