machine-learning - 为一组用户训练 ML 分类器

标签 machine-learning nlp

我有一个机器学习项目,该项目给出了一组用户对一系列在线文章的 react (通过喜欢/不喜欢的方式显示),我需要对新到达的文章做出决定。

该任务要求根据每个人的 react 来预测新到达的文章是否应该被考虑推荐给整个社区。

我一直在想,我应该如何整合每个用户的反馈来决定这是否是一篇值得推荐的有趣文章。

请记住,在用户的 react 中,可能会有喜欢和不喜欢同一篇文章的用户,有没有办法整合所有这些信息并得出有关该文章的结论?

提前谢谢您。

最佳答案

有很多不同的方法可以确定什么是“有趣的”。我认为 Reddit 在考虑不同的选择时有一个非常好的模型可供引用。它们有不同的类别,例如“热门”或“有争议的”等。

因此,根据您/您的教授的需求,有几个选择:

  • 获取净喜欢数(喜欢 = +1,不喜欢 = -1)
  • 仅获取点赞数
  • 获取评分总数(谁读过)
  • 选取喜欢与不喜欢比例最高的内容
  • 这些东西的一些组合

等等

所以你可以尝试很多不同的事情。也许尝试一些,看看哪个产生的结果最像你想要的?

就如何预测文章是否与您已有信息的文章进行比较而言,这是一个更广泛的问题,但我认为这不是您要问的,并且看起来这就是机器学习项目的目的。

关于machine-learning - 为一组用户训练 ML 分类器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27001935/

相关文章:

python - NLTK 的拼写检查器无法正常工作

machine-learning - 可以将 Terraform 模板与 SageMaker ML Pipelines 结合使用吗?

在Android中运行TensorFlow模型时出现java.nio.BufferOverflowException运行时错误?

python-2.7 - 人脸识别中预测未知面孔

r - 使用 R、支持向量机预测简单序列

python - 如何从列表列表中过滤特定的 POS 标签到单独的列表?

emacs M-e 在 tex 模式下无法正常工作

java - Java 中的名词类型确定

nlp - 如何消除 Conceptnet 中的单词歧义

machine-learning - 坐标下降和次梯度的解释