r - 在 R 中进行主成分分析时,如何判断是否首先标准化数据矩阵更好?

标签 r statistics pca numerical-methods

我正在尝试在 R 中进行主成分分析。我相信有两种方法可以做到这一点。 一种是立即进行主成分分析,另一种方法是首先使用s = scale(m)标准化矩阵,然后应用主成分分析。
我如何知道哪个结果更好?我特别应该关注哪些值(value)观?我已经设法使用这两种方法找到特征值和特征向量,以及每个特征向量的方差比例。

我注意到未经标准化的第一个主成分分析的方差比例具有更大的值。它有什么意义吗?情况不总是如此吗?

最后,如果我要预测一个变量(即权重),那么在进行主成分分析时,我是否应该从数据矩阵中删除该变量(即权重)?

最佳答案

您的变量是按通用标准衡量的吗?如果是,则不要扩展。如果不是,那么扩展可能是个好主意。

如果您尝试预测另一个变量的值,PCA 可能不是正确的工具。也许您应该看看回归模型。

关于r - 在 R 中进行主成分分析时,如何判断是否首先标准化数据矩阵更好?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1777351/

相关文章:

将数据框列中的 NA 值替换为向量中元素的值

r - 如何在行数变化时绑定(bind)向量和矩阵

R 错误消息 - "arguments imply differing number of rows"

php - 使用 php/mysql 从表中获取统计数据的算法/查询

matlab - 输入参数太多,即使使用 varargin

R 绘制连续数据的平均值 + SD

r - 使用 knitR 显示 R 输出的子集

r - 找到最小值/谷点并获取 R 中谷点开始和谷点结束的索引

python - Spark 中的 PCA 输出与 scikit-learn 不匹配

python - 多个 3D 阵列(曲线)的采样/插值