algorithm - 优化参数的类强盗算法?

标签 algorithm machine-learning mathematical-optimization bayesian ab-testing

我需要一种算法来优化我在一周中向用户显示消息的时间,以确保用户点击消息的可能性最大。

显示消息时,数据库条目将更新为日期/时间以及用户是否单击。目标是最大化点击率。

我很乐意使用贝叶斯 Bandits(也称为 Thompson 采样)( https://github.com/omphalos/bayesian-bandit.js ) 在 N 个离散参数的情况下进行优化,但我不知道如何将其应用于连续值。

我很了解标准的爬山算法,但我只了解如何在没有统计噪声的情况下应用爬山算法。是否有一种简单的贝叶斯方法可以优化探索/开发权衡来进行爬山?

对于bonus point,有没有一种方法可以泛化到多维,同时优化多个参数,在多维空间中找到最优点?

最佳答案

与贝叶斯老虎 secret 切相关的是贝叶斯混合模型。您可以将贝叶斯老虎机视为 delta functions 的贝叶斯混合。 .这消除了离散性约束。相反,您可以将连续空间上的分布建模为连续值随机变量的总和。例如,您可以假设有 5 个“点击源”,每个都在一个小时(上午 8 点、上午 9 点......)附近服从正态分布,并且标准偏差为 15 分钟。因此,当您在 8:05 获得点击时,您会将其主要归因于上午 8 点模型,将较少的数量归因于上午 9 点的模型,将更少的数量归因于上午 10 点的模型,依此类推。

估计混合模型的常用算法是 Expectation-Maximization .您应该能够找到好的开源实现。请注意,上述描述(和 EM)在多变量情况下继续成立。

关于algorithm - 优化参数的类强盗算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24619525/

相关文章:

java - 从排序列表中获取间隔的最快方法?

c++ - 使用 BFS 的最短距离

algorithm - 1秒解决16皇后问题

machine-learning - 告诉 Weka 在 ARFF 文件中预测哪些属性?

java - 模运算符在 Java 中给出意外的输出

javascript - 查找最新更新json的有效算法

tensorflow - 参差不齐的张量作为 LSTM 的输入

python - 将用户输入实现到神经网络中

c++ - Ceres 求解器 C++ : Segmentation fault: 11

mathematical-optimization - 如何确定蚁群优化中的 Ant 数量