reinforcement-learning - 如何处理强化学习中的同时 Action

标签 reinforcement-learning

我正在尝试使用强化学习来解决涉及大量同步操作的问题。例如,智能体将能够采取可导致单一 Action 的 Action ,如射击,或可导致多个 Action 的 Action ,如跳跃时射击、右转、空手道砍等。当所有可能的 Action 结合起来,我最终得到一个巨大的 Action 数组,比如 1 x 2000。所以我的 LSTM 网络输出数组将有那个大小。当然,我会使用字典来解码 Action 数组以应用 Action 。所以我的问题是,那个 Action 数组是不是太大了?这是处理同时 Action 的方法吗?还有其他方法吗?请随意链接您看到的任何具体示例。谢谢。

最佳答案

关于reinforcement-learning - 如何处理强化学习中的同时 Action ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63330428/

相关文章:

python - 运行时错误 ("grad can be implicitly created only for scalar outputs")

neural-network - 强化学习。使用 PPO 绕过物体行驶

algorithm - 具有线性函数逼近的 Q 学习

machine-learning - 为什么强盗问题在强化学习中也被称为一步/状态 MDP?

neural-network - OpenAI 健身房的月球着陆器模型未收敛

machine-learning - 强化学习文献中的 "soft"是什么意思?

machine-learning - 时间差异更新规则

python - 无法使用 Q-Learning 和函数逼近来学习 MountainCar

machine-learning - 我应该使用强化学习将哪些内容保存到文件/数据库中?

deep-learning - OpenAI健身房: How to get pixels in CartPole-v0