我需要一种方法或算法来根据他的推文预先计算用户的兴趣..
用户将他的帐户与他的 Twitter 帐户相关联,在第一次检索他的推文后,我将不得不预先计算他的品味和兴趣。
随着该用户继续使用我的系统,我将不得不使这些预测更加准确..
是否有算法或数学模型可以帮助满足此要求?
请提供 - 现有的研究链接或开源代码或示例,这将帮助我开始......
最佳答案
您可以使用 Machine-Learning为了这个任务。
一种可能的机器学习算法是具有 k 个最近邻的词袋:
创建一个 training set [您知道他们感兴趣的用户],并使用 Bag Of Words [最好用n-grams ] 来“学习”训练集。
当新用户到达时 - 将单词/n-gram 提取为特征 - 并找到 k nearest neighbors 以确定利益是什么。
要随着时间的推移获得改进 - 您可以获得一些额外的明确反馈 - 用户可以点击同意/不同意算法所说的内容。您稍后可以使用此信息来扩展训练集的大小 - 这可能会导致更准确的决策。
这是学习句子/单词集之间“特征”的标准算法,因此您至少应将其用作指南。
还有一个开源项目可能对您有所帮助:Apache Mahout .
关于algorithm - 预先计算用户兴趣,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9511863/