python-3.x - 为什么要打开 openAI 健身房?

标签 python-3.x reinforcement-learning openai-gym

在使用 openAI gym 作为学习环境时,我试图对强化学习有所了解。我通过阅读《使用 Python 进行强化学习实践》一书来做到这一点。在本书中,提供了一些代码。通常,代码不起作用,因为我必须先将其解包,如:openai gym env.P, AttributeError 'TimeLimit' object has no attribute 'P'

但是,我个人仍然对这种展开的原因感兴趣。为什么需要拆包?这到底是做什么的?为什么书中没有这样编码?它是 Giuliov 假设的过时软件吗?

提前致谢。

最佳答案

Open AI Gym 提供了许多不同的环境。他们每个人都有自己的一组参数和方法。然而,它们通常由一个名为 Env 的类(如真实 OOPL 上的接口(interface))包装。 .此类公开了任何环境中常用的最基本方法,例如 step , resetseed .拥有这个“接口(interface)”类很棒,因为它允许您的代码与环境无关。如果您想在不同的环境中测试单个代理,它也会使事情变得更容易。

但是,如果您想访问特定环境的幕后动态,则使用 unwrapped属性(property)。

关于python-3.x - 为什么要打开 openAI 健身房?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53836136/

相关文章:

python - 子进程在完成之前终止 PowerShell 脚本

python - If 条件检查变量类型(int、float 等)

algorithm - 关键词联想学习算法

development-environment - OpenAI-Gym 中的自定义环境

python 3.3 : Unable to load an image using Pygame if game folder is not in C drive

python - 打印列表中的所有项目,它们之间有两个空格

python - OpenAI gym 和 Python 线程

c - 如何轻松可视化 C 应用程序生成的调试数据?

xml - 制作我自己的 mujoco 环境的最佳方法是什么?

python - 没有名为 spinup.run 的模块