algorithm - 预先计算用户兴趣

我需要一种方法或算法来根据他的推文预先计算用户的兴趣..

用户将他的帐户与他的 Twitter 帐户相关联，在第一次检索他的推文后，我将不得不预先计算他的品味和兴趣。

随着该用户继续使用我的系统，我将不得不使这些预测更加准确..

是否有算法或数学模型可以帮助满足此要求？

请提供 - 现有的研究链接或开源代码或示例，这将帮助我开始......

最佳答案

您可以使用 Machine-Learning为了这个任务。

一种可能的机器学习算法是具有 k 个最近邻的词袋:

创建一个 training set [您知道他们感兴趣的用户]，并使用 Bag Of Words [最好用n-grams ] 来“学习”训练集。

当新用户到达时 - 将单词/n-gram 提取为特征 - 并找到 k nearest neighbors 以确定利益是什么。

要随着时间的推移获得改进 - 您可以获得一些额外的明确反馈 - 用户可以点击同意/不同意算法所说的内容。您稍后可以使用此信息来扩展训练集的大小 - 这可能会导致更准确的决策。

这是学习句子/单词集之间“特征”的标准算法，因此您至少应将其用作指南。

还有一个开源项目可能对您有所帮助:Apache Mahout .

关于algorithm - 预先计算用户兴趣，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9511863/

相关文章：

algorithm - 你知道将树结构映射到表表示的有效算法吗