apache-spark - Spark 中的混合推荐器

标签 apache-spark apache-spark-mllib mahout-recommender predictionio

我正在尝试使用 Prediction.io 构建一个混合推荐器,该推荐器在底层充当 Spark/mllib 之上的一层。

我正在寻找一种在执行推荐请求时将基于标签的提升合并到 ALS 算法中的方法。

使用内容信息来改进协作过滤似乎是一种常见的路径,尽管我找不到任何有关将协作算法(例如 ALS)与基于内容的度量相结合的文档。

任何有关将内容相似性与 mllib (spark) 或 mahout (hadoop) 的协作过滤相结合的示例或文档将不胜感激。

最佳答案

此 PredictionIO 模板使用 Mahout 的 Spark 版本的 Correlators,因此它可以利用多个操作向用户推荐或查找相似的项目。它允许您包含多个类似分类标签的内容来增强或过滤推荐。

http://templates.prediction.io/PredictionIO/template-scala-parallel-universal-recommendation

v0.2.0 分支还具有日期范围过滤功能,热门项目回填功能正在开发中。

关于apache-spark - Spark 中的混合推荐器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31677460/

相关文章:

apache-spark - 使用 Apache Spark ML,您如何转换(用于预测)没有标签的数据集?

scala - Spark : How to create categoricalFeaturesInfo for decision trees from LabeledPoint?

python - 构造 ClassDict 的预期参数为零(对于 pyspark.ml.linalg.SparseVector)

python - Spark 执行时间与 AWS EMR 上的节点数量

apache-spark - EMR 无服务器上的 Spark-cassandra-connector (PySpark)

database - Spark 中的快速条件加入

mahout - 基于项目和基于内容的协同过滤有什么区别?

java - Mahout 在行动 : Chapter 06: Wikipedia job fails with java. lang.ArrayIndexOutOfBoundsException

mahout - 根据项目属性查找相似项目

dictionary - Spark mapPartitions 与 transient 惰性 val