换句话说,什么类型的人工智能仅根据游戏的当前状态做出决策?提前致谢!
最佳答案
从最严格的意义上来说,一个纯粹的反射代理可能满足这些条件。反射智能体仅根据先前的感知或当前的世界模型来选择行动,因此根据您认为“考虑”的内容,这可能符合要求。
但是,在我看来,这确实超出了突破范围。
MDP 设置中的代理,为该设置运行策略,可以说仅根据状态做出决策,而不考虑 future 。但这只会引出一个问题:这项政策从何而来?显然,它来自对特定国家采取特定行动的 future 返回的仔细概率考虑。或者换句话说,智能体的算法可能是“运行这个策略”,但确定策略的算法和策略本身的 future 导向才是真正的智能所在。我们认为代理通过确定该策略而变得聪明。
(从概念上讲,反射代理的概念实际上是代理对过去而不是 future 的处理和考虑。我上面所说的在技术意义上是正确的,而不是重要的哲学意义上。)
根据定义,规划领域中的所有人工智能都是面向 future 的。如果你没有在某种程度上考虑你的行为对 future 的结果,那么你就不是一个聪明的代理人。
关于machine-learning - 什么样的人工智能会在不考虑 future 的情况下做出选择?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20593118/