我有一个大的(500k x 500k)稀疏矩阵。我想得到它的主要组成部分(事实上,即使只计算最大的 PC 也可以)。随机 PCA 效果很好,除了它本质上是寻找协方差矩阵的特征向量而不是相关矩阵。关于使用大型稀疏矩阵的协方差矩阵找到 PCA 的包的任何想法?最好在 python 中,尽管 matlab 和 R 也可以。
(作为引用,有人问了一个类似的问题 here 但这些方法指的是协方差矩阵)。
最佳答案
它们不是一回事吗?据我了解,相关矩阵只是由每个变量的标准差的乘积归一化的协方差矩阵。而且,如果我没记错的话,PCA 中是否存在缩放歧义?
关于python - 使用相关矩阵在大型稀疏矩阵上进行 PCA,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13592841/