交替最小二乘法 ( http://spark.apache.org/docs/latest/mllib-collaborative-filtering.html ) 的 Spark MLlib 实现是否需要手动创建训练集的所有零条目(用户没有与产品交互的历史记录的用户产品组合),评级为0,或者算法会自动暗示所有缺失组合的评级为零?
最佳答案
训练集可以是稀疏的,事实上,应该是稀疏的——否则你将付出(可能是严重的)性能损失。请参阅this discussion在 Spark 用户邮件列表上了解更多信息。
关于linear-algebra - ALS 是否需要零条目?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42214638/