machine-learning - 协同过滤可以应用于疾病检测吗?

标签 machine-learning collaborative-filtering

浏览一些有关协同过滤的教程,我发现它主要用于电影和书籍推荐,以及包含用户及其评分项目的数据集。当然,每个项目的评分范围是相同的(例如 1-10)。但是如果我有一个具有不同范围的数据集怎么办?这意味着一个完全不同的数据集,与人们如何评价某个项目无关,而是基于人们的医疗记录。我正在考虑使用记录中的特征(例如 BMI、体重、高度等)作为项目,并将用户作为拥有该记录的人。基本上在该过程结束时,我想根据已经具有预定输出的其他记录来确定一个人是否患有疾病。我知道这通常/可以很容易地在神经网络中完成。但我真的想知道这在协作过滤中是否也可行。或者不是吗?

最佳答案

不是推荐问题,这是经典分类,仅此而已。神经网络只是数十种可能的方法之一,但再次强调 - 它不是协同过滤,它正是分类的定义方式。在协作过滤中,您不知道正确的答案(标签/输出) - 您只需尝试在其他模式中找到一些常见模式。在疾病检测/预测的情况下,您确切地知道应该输出什么。

如果您有非常广泛的可能的相关疾病,并且患有这种疾病的人数非常少(因此不可能实际为这些疾病建立训练集),那么可以在这里使用推荐系统。那么这种寻找潜在健康问题的“建议”就有意义了。在标记的二进制输出数据的情况下,它只是一个分类。尽管如此,您可能最终会得到这样的模型:“如果您肥胖,那么您可能会心脏病发作”等。因此,寻找类似诊断之间的相关性。

关于machine-learning - 协同过滤可以应用于疾病检测吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18738505/

相关文章:

scala - 带 Spark 的 LDA 模型

python - 不同阈值的特异性(与 sklearn.metrics. precision_recall_curve 相同)

hadoop - 免费提供的真实公共(public)数据

斯卡拉.MatchError : null on spark RDDs

推荐系统中的矩阵分解方法

mysql - 返回与 SQL 中另一个用户相同的行(协同过滤)

c - 维护一个单独的迭代函数可以继续访问的排序数组

python - 使用 Keras 和 TensorFlow 实现 LSTM 网络

php - Slope One 实现提供了糟糕的建议

java - 如何使用训练、测试和验证数据集在 Apache Spark MLlib 的 ALS 中训练矩阵分解模型