language-agnostic - 强化学习的良好实现？

对于一个人工智能级项目，我需要实现一个强化学习算法，该算法可以击败简单的俄罗斯方 block 游戏。该游戏是用 Java 编写的，我们有源代码。我了解强化学习理论的基础知识，但想知道 SO 社区中是否有人有此类事情的实践经验。

编辑:越具体越好，但欢迎有关该主题的一般资源。

跟进:

我想如果我发布后续内容就好了。

这是我最终为 future 的学生提供的解决方案(代码和文章):)。

<强> Paper / Code

最佳答案

看看2009年RL-competition 。问题域之一是 tetris game 。前年也出现过俄罗斯方 block 问题。这是52-page final report来自当年的第五名决赛入围者，其中详细介绍了代理的工作原理。

关于language-agnostic - 强化学习的良好实现？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/740389/

相关文章：

c++ - 如何在两个排序数组的并集中找到第 k 个最大的元素？