对于一个人工智能级项目,我需要实现一个强化学习算法,该算法可以击败简单的俄罗斯方 block 游戏。该游戏是用 Java 编写的,我们有源代码。我了解强化学习理论的基础知识,但想知道 SO 社区中是否有人有此类事情的实践经验。
- 对于在俄罗斯方 block 游戏中实现强化学习,您推荐的读物是什么?
- 是否有任何优秀的开源项目可以完成类似的事情,值得一试?
编辑:越具体越好,但欢迎有关该主题的一般资源。
跟进:
我想如果我发布后续内容就好了。
这是我最终为 future 的学生提供的解决方案(代码和文章):)。
最佳答案
看看2009年RL-competition 。问题域之一是 tetris game 。前年也出现过俄罗斯方 block 问题。这是52-page final report来自当年的第五名决赛入围者,其中详细介绍了代理的工作原理。
关于language-agnostic - 强化学习的良好实现?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/740389/