我正在尝试在 R 中进行主成分分析。我相信有两种方法可以做到这一点。
一种是立即进行主成分分析,另一种方法是首先使用s = scale(m)
标准化矩阵,然后应用主成分分析。
我如何知道哪个结果更好?我特别应该关注哪些值(value)观?我已经设法使用这两种方法找到特征值和特征向量,以及每个特征向量的方差比例。
我注意到未经标准化的第一个主成分分析的方差比例具有更大的值。它有什么意义吗?情况不总是如此吗?
最后,如果我要预测一个变量(即权重),那么在进行主成分分析时,我是否应该从数据矩阵中删除该变量(即权重)?
最佳答案
您的变量是按通用标准衡量的吗?如果是,则不要扩展。如果不是,那么扩展可能是个好主意。
如果您尝试预测另一个变量的值,PCA 可能不是正确的工具。也许您应该看看回归模型。
关于r - 在 R 中进行主成分分析时,如何判断是否首先标准化数据矩阵更好?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1777351/