r - 在 R 中进行主成分分析时，如何判断是否首先标准化数据矩阵更好？

标签 r statistics pca numerical-methods

我正在尝试在 R 中进行主成分分析。我相信有两种方法可以做到这一点。一种是立即进行主成分分析，另一种方法是首先使用s = scale(m)标准化矩阵，然后应用主成分分析。
我如何知道哪个结果更好？我特别应该关注哪些值(value)观？我已经设法使用这两种方法找到特征值和特征向量，以及每个特征向量的方差比例。

我注意到未经标准化的第一个主成分分析的方差比例具有更大的值。它有什么意义吗？情况不总是如此吗？

最后，如果我要预测一个变量(即权重)，那么在进行主成分分析时，我是否应该从数据矩阵中删除该变量(即权重)？

最佳答案

您的变量是按通用标准衡量的吗？如果是，则不要扩展。如果不是，那么扩展可能是个好主意。

如果您尝试预测另一个变量的值，PCA 可能不是正确的工具。也许您应该看看回归模型。

关于r - 在 R 中进行主成分分析时，如何判断是否首先标准化数据矩阵更好？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1777351/