我正在尝试使用 Prediction.io 构建一个混合推荐器,该推荐器在底层充当 Spark/mllib 之上的一层。
我正在寻找一种在执行推荐请求时将基于标签的提升合并到 ALS 算法中的方法。
使用内容信息来改进协作过滤似乎是一种常见的路径,尽管我找不到任何有关将协作算法(例如 ALS)与基于内容的度量相结合的文档。
任何有关将内容相似性与 mllib (spark) 或 mahout (hadoop) 的协作过滤相结合的示例或文档将不胜感激。
最佳答案
此 PredictionIO 模板使用 Mahout 的 Spark 版本的 Correlators,因此它可以利用多个操作向用户推荐或查找相似的项目。它允许您包含多个类似分类标签的内容来增强或过滤推荐。
http://templates.prediction.io/PredictionIO/template-scala-parallel-universal-recommendation
v0.2.0 分支还具有日期范围过滤功能,热门项目回填功能正在开发中。
关于apache-spark - Spark 中的混合推荐器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31677460/