apache-spark - Spark 中的混合推荐器

我正在尝试使用 Prediction.io 构建一个混合推荐器，该推荐器在底层充当 Spark/mllib 之上的一层。

我正在寻找一种在执行推荐请求时将基于标签的提升合并到 ALS 算法中的方法。

使用内容信息来改进协作过滤似乎是一种常见的路径，尽管我找不到任何有关将协作算法(例如 ALS)与基于内容的度量相结合的文档。

任何有关将内容相似性与 mllib (spark) 或 mahout (hadoop) 的协作过滤相结合的示例或文档将不胜感激。

最佳答案

此 PredictionIO 模板使用 Mahout 的 Spark 版本的 Correlators，因此它可以利用多个操作向用户推荐或查找相似的项目。它允许您包含多个类似分类标签的内容来增强或过滤推荐。

v0.2.0 分支还具有日期范围过滤功能，热门项目回填功能正在开发中。

关于apache-spark - Spark 中的混合推荐器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31677460/