reinforcement-learning - 为什么我们总是需要为开放健身房ai设置env.seed(#)?

标签 reinforcement-learning openai-gym

我第一手发现所有强化学习算法都需要设置env.seed(#),我想知道背后的原因。

非常感谢!

最佳答案

我使用过的所有健身房环境都使用过numpy's random number generator 。您当然不需要自己播种,因为它将回退到当前时钟时间的播种。每当您担心再现性时,都会手动指定种子。如果您不为 RNG 提供相同的种子,它将产生不同的随机数序列。由于机器学习是由经验驱动的,因此可重复性非常重要。

关于reinforcement-learning - 为什么我们总是需要为开放健身房ai设置env.seed(#)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55187826/

相关文章:

python - 如何修复 Heroku Openai Django 部署错误?

machine-learning - 策略梯度方法和基于神经网络的 Action 值方法有什么区别?

reinforcement-learning - 一步多 Action ,强化学习

python - 如何根据另一个 torch 张量中的索引更改 torch 张量中的某些值?

deep-learning - gym.spaces.box 观察状态理解

python OpenAI健身房监视器在录制目录中创建json文件

python - 在强化学习中标准化奖励以产生返回

Python - 用 gym 制作的脚本在 Mac 上不起作用

reinforcement-learning - 我们需要gym环境的 "metadata"字段做什么?