如果我想研究机器人强化学习算法,我应该如何使用 Gazebo 和 OpenAI Gym 来测试、训练和基准测试算法?我是否应该从 OpenAI Gym 开始,将得分较高的算法引入到 Gazebo 环境中以实现真实场景?
最佳答案
选择要使用的框架时要考虑的因素
- 需要多少时间才能跟上您所选择的内容?
- 环境中的表现能否可靠地预测实际机器人的表现?
- 要花多少钱?
如果您希望您的方法最终适用于实际的机器人,您应该在密切模拟您的目标环境和平台的环境中进行测试。 OpenAI 健身房的 first party robot simulation environments使用 MuJuCo,它不是免费的。此外,这些模拟更多的是针对玩具控制设置,而不是实际的机器人问题。编写 ROS 节点并在 Gazebo 中模拟您的问题会更好。您还可以查看 Erle Robotics 的 gym-gazebo 等内容。工具可以让你在gym和ROS之间架起桥梁。
关于benchmarking - OpenAI Gym 和 Gazebo 来测试机器人的 RL 算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43049314/