reinforcement-learning - 为什么我们总是需要为开放健身房ai设置env.seed(#)？

我第一手发现所有强化学习算法都需要设置env.seed(#)，我想知道背后的原因。

非常感谢!

最佳答案

我使用过的所有健身房环境都使用过numpy's random number generator 。您当然不需要自己播种，因为它将回退到当前时钟时间的播种。每当您担心再现性时，都会手动指定种子。如果您不为 RNG 提供相同的种子，它将产生不同的随机数序列。由于机器学习是由经验驱动的，因此可重复性非常重要。

关于reinforcement-learning - 为什么我们总是需要为开放健身房ai设置env.seed(#)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55187826/

上一篇：r - 强制 `read_tsv`解压文件

下一篇：object - Treeview 中的返回对象导致 "Maximum call stack size exceeded"Vuetify

machine-learning - 策略梯度方法和基于神经网络的 Action 值方法有什么区别？

reinforcement-learning - 一步多 Action ，强化学习

python - 如何根据另一个 torch 张量中的索引更改 torch 张量中的某些值？

deep-learning - gym.spaces.box 观察状态理解

python OpenAI健身房监视器在录制目录中创建json文件

python - 在强化学习中标准化奖励以产生返回

Python - 用 gym 制作的脚本在 Mac 上不起作用

reinforcement-learning - 我们需要gym环境的 "metadata"字段做什么？