python - 如何撤消 OpenAI Gym 中的操作？

标签 python reinforcement-learning openai-gym

在 OpenAI Gym 中，我想知道同一状态下不同操作的下一个状态。例如，我想获取 s_1、s_2，其中我的环境动态是:

(s, a_1) -> s_1, (s, a_2) -> s_2

我找不到在不改变环境的情况下撤消操作或显示下一个状态的方法。我是否遗漏了一些明显的东西？

如果有帮助，我这样做是为了区分 LQR 的动态和奖励，并使用 InvertedPendulum 环境。

最佳答案

我发现一个名为 set_state 的方法正是执行此操作。可以在以下位置找到: https://github.com/openai/gym/blob/12e8b763d5dcda4962cbd17887d545f0eec6808a/gym/envs/mujoco/mujoco_env.py#L86-L92

关于python - 如何撤消 OpenAI Gym 中的操作？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39147440/

上一篇：python - 属性错误: 'module' object has no attribute 'Graph'

下一篇：python - 一组 pandas 数据帧内的行操作

相关文章：

python - DQN Pytorch Loss 不断增加

用于多个标签的 Python 正则表达式

python - 无法将关键字 'is_active' 解析为字段？选项包括 : active, 管理员、电子邮件、全名、id 等

Python-挑战级别 3

python - 应该使用哪种OpenAIgym环境来解决最短路径问题？

python - 当 Scrapy 蜘蛛遇到指定的 URL 时停止它

google-colaboratory - 如何在 colab 中运行 env.render()

python-3.x - 使用 conda 4.3.21 为 python 3.6 安装 pybox2d

python-3.x - 在env.render()之后出现OpenAI错误

©2024 IT工具网联系我们