最近我正在使用 python 的 pandas 和 scikit-learn 库学习统计学习,它们对我来说是很棒的工具。
我本可以学习分类、回归和聚类的方法。
但是,当我想制作推荐模型时,我找不到如何从它们开始的方法。例如,如果我有一个客户的购买数据集,其中包含日期、产品名称、产品制造商、价格、订购设备等...
推荐的问题类型是什么?分类、回归或其他?
事实上,当有人要解决这个问题时,我会发现有非常著名的算法,比如协同过滤。
如果是这样,我可以通过 scikit-learn 使用这些算法吗?还是我必须学习另一个 M.L 库?
问候
最佳答案
Scikit-learn 不提供任何推荐系统工具。你可以看看mahout这给出了真正容易开始的命题或spark .
然而推荐在机器学习词中本身就是一个问题。例如,如果您试图预测用户对电影的评分,则可以是回归;如果您想知道用户是否喜欢这部电影,则可以是分类(二元选择)。 重要的是,推荐是使用专用于解决此问题的工具和算法,例如基于项目或基于内容的推荐。这些概念实际上很容易理解,自己实现一个小的推荐引擎可能是最好的。
我建议你看书mahout in action这是对推荐概念的一个很好的介绍
关于python - 如何使用 python 的 scikit-learn 制作推荐模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33623144/