algorithm - 预先计算用户兴趣

标签 algorithm design-patterns

我需要一种方法或算法来根据他的推文预先计算用户的兴趣..

用户将他的帐户与他的 Twitter 帐户相关联,在第一次检索他的推文后,我将不得不预先计算他的品味和兴趣。

随着该用户继续使用我的系统,我将不得不使这些预测更加准确..

是否有算法或数学模型可以帮助满足此要求?

请提供 - 现有的研究链接或开源代码或示例,这将帮助我开始......

最佳答案

您可以使用 Machine-Learning为了这个任务。

一种可能的机器学习算法是具有 k 个最近邻的词袋:

创建一个 training set [您知道他们感兴趣的用户],并使用 Bag Of Words [最好用n-grams ] 来“学习”训练集。

当新用户到达时 - 将单词/n-gram 提取为特征 - 并找到 k nearest neighbors 以确定利益是什么。

要随着时间的推移获得改进 - 您可以获得一些额外的明确反馈 - 用户可以点击同意/不同意算法所说的内容。您稍后可以使用此信息来扩展训练集的大小 - 这可能会导致更准确的决策。

这是学习句子/单词集之间“特征”的标准算法,因此您至少应将其用作指南。

还有一个开源项目可能对您有所帮助:Apache Mahout .

关于algorithm - 预先计算用户兴趣,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9511863/

相关文章:

algorithm - 你知道将树结构映射到表表示的有效算法吗

c++ - 这是哪个设计模式 : Factory Method or Abstract Factory

c# - 从 MVP Winform 客户端使用 WebAPI 的设计模式

php - 单例结合 PHP5 中的工厂模式

algorithm - 在采访中无法弄清楚这一点。找到这个数组中的最小循环?

将相似词映射到相似颜色的算法

函数的 JavaScript 命名

algorithm - 如何在 libsvm 中为训练和测试文件创建源数据文件?

c# - 长时间运行的有状态 'services' 适合 DDD 的什么地方?

java - 如何避免观察者模式中的无限循环?