python - 如何处理python scikit NMF中的缺失值

标签 python scikit-learn recommendation-engine svd matrix-factorization

我正在尝试使用 python scikit-learn 在我的数据集上应用 NMF。我的数据集包含 0 个值和缺失值。但是 scikit-learn 不允许在数据矩阵中使用 NaN 值。一些帖子说用零替换缺失值。

我的问题是:

  • 如果我用零替换缺失值,算法如何区分缺失值和实际零值?

  • 是否有任何其他 NMF 实现可以处理缺失值?

  • 或者有没有其他矩阵分解算法可以做缺失值预测?

最佳答案

在 scikit-learn github 中有一个关于这个的线程和一个版本接缝可用但尚未提交到主要代码。

https://github.com/scikit-learn/scikit-learn/pull/8474

关于python - 如何处理python scikit NMF中的缺失值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39367597/

相关文章:

python - 其他人如何在 RESTful API 中实现复杂的过滤?

python - TFS 网络服务文档

python - LightGBM-分类指标无法处理二进制和连续目标的混合

python - sklearn - 无法立即调用 MultiLabelBinarizer 的 inverse_transform

c - 对正则表达式解析器的 C 实现的建议

python - 创建一个由交替的零和随机数组成的矩阵?

Python:set.add() 函数不添加重复项吗?

machine-learning - 分类中如何选择正确的类别编码方法

algorithm - 信心和支持的 Mahout 算法

python - 如何构建一个使用多个属性的基于内容的推荐系统?