我正在尝试使用 python scikit-learn 在我的数据集上应用 NMF。我的数据集包含 0 个值和缺失值。但是 scikit-learn 不允许在数据矩阵中使用 NaN 值。一些帖子说用零替换缺失值。
我的问题是:
如果我用零替换缺失值,算法如何区分缺失值和实际零值?
是否有任何其他 NMF 实现可以处理缺失值?
或者有没有其他矩阵分解算法可以做缺失值预测?
最佳答案
在 scikit-learn github 中有一个关于这个的线程和一个版本接缝可用但尚未提交到主要代码。
关于python - 如何处理python scikit NMF中的缺失值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39367597/