python - 如何让Python代理观察?

标签 python machine-learning openai-gym

我正在尝试制作一个简单的Python代理,它可以检测游戏中的回合并相应地向左或向右转。但是,我对如何让代理观察屏幕以及如何在我的代码中实现代理感到困惑。

我对机器学习和健身还很陌生。我有下面使用健身房的基本布局,

import gym
import universe

env = gym.make(‘flashgames.NeonRace-v0’)
env.configure(remotes=1)
observation_n = env.reset()

while True:
    action_n = [[('KeyEvent', 'ArrowUp', True)] for ob in observation_n]
    #Your agent here
    observation_n, reward_n, done_n, info = env.step(action_n)
    env.render()

下面是代理的布局,

def getAgent():
   """ The daemon searches for this callable function to create a new agent with """
   return MyAgent()

class MyAgent(object):

    def __init__(self):
       """ standard object init """
       self.done = False

    def run(self, messaging, args):
       """ Call by daemon when the agent is to start running """
       while not self.done:
           pass

    def stop(self):
       """ Called by daemon when the thread is requested to stop """
       self.done = True

我会开始实现代码,但每当它要观察屏幕时我就会陷入困境。

最佳答案

您已经在 env.reset() 和 env.step(action_n) 的返回中获得了观察结果。代理应该进行观察并使用某种监督学习方法(例如深度神经网络)来根据观察来预测行动。这就是你所缺少的吗?

关于python - 如何让Python代理观察?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56282507/

相关文章:

python - 多对多关系 - django

javascript - 使用 jquery 和 javascript 改变图像的大小

python - TensorFlow 神经网络的输出不会改变

pytorch - 为什么多层感知器在 CartPole 中优于 RNN?

reinforcement-learning - 一步多 Action ,强化学习

python - 如何将数据帧与数组时间戳合并并根据数组的条件进行绘图?

python - Pandas Dataframe 中的透视行

python - TensorFlow 在类别验证中找不到图像

machine-learning - 在词袋中使用词性标记

development-environment - OpenAI-Gym 中的自定义环境