我第一手发现所有强化学习算法都需要设置env.seed(#),我想知道背后的原因。
非常感谢!
最佳答案
我使用过的所有健身房环境都使用过numpy's random number generator 。您当然不需要自己播种,因为它将回退到当前时钟时间的播种。每当您担心再现性时,都会手动指定种子。如果您不为 RNG 提供相同的种子,它将产生不同的随机数序列。由于机器学习是由经验驱动的,因此可重复性非常重要。
关于reinforcement-learning - 为什么我们总是需要为开放健身房ai设置env.seed(#)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55187826/