development-environment - OpenAI-Gym 中的自定义环境

标签 development-environment reinforcement-learning openai-gym

我想尝试用 Python 进行强化学习。但我想创建一个具有我自己的状态和奖励的自定义环境。

可能我想在其中使用时间序列数据(不过与股票不同)。我希望我的系统能够根据给定环境的时间来学习行为。

所以我首先会创建一个自定义环境，有人可以帮我吗？

最佳答案

OpenAIgym环境注册流程可以在gym文档here中找到.

您还可以查看this示例自定义环境和 this stackoverflow 问题以获取更多信息。

Possibly I want to use Time-Series Data in this(nothing like Stocks though). I want my system to learn behaviors according to time, given an environment.

如果您希望代理学习 w.r.t.然后将时间步作为您状态中的变量包括在内。然后你的代理将能够区分时间步长不同的两个不同状态。

关于development-environment - OpenAI-Gym 中的自定义环境，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54800340/

上一篇：r - tidyR嵌套并完成: avoid group_by (or data table equivalent)

下一篇：reactjs - 如何使用react-transition-group设置退出动画

相关文章：

c++ - 设置树莓派的开发环境

machine-learning - 推广具有大状态和 Action 空间的基于模型的强化学习算法的策略

random - OpenAI 环境(健身房)应该如何使用 env.seed(0)？

python - Pygame 和 Open AI 实现

pytorch - 为什么多层感知器在 CartPole 中优于 RNN？

asp.net - Oracle/ASP.NET 环境的最佳源代码控制解决方案？

accessibility - 如果你是盲人，你怎么能编程呢？

reinforcement-learning - OpenAI Gym : Understanding `action_space` notation (spaces. 盒子)

pytorch - net.zero_grad() 与 optim.zero_grad() pytorch

windows-7 - 我应该切换到 Windows 7 进行初级开发吗？