python - 使用相关矩阵在大型稀疏矩阵上进行 PCA

标签 python matlab numpy machine-learning sparse-matrix

我有一个大的(500k x 500k)稀疏矩阵。我想得到它的主要组成部分(事实上,即使只计算最大的 PC 也可以)。随机 PCA 效果很好,除了它本质上是寻找协方差矩阵的特征向量而不是相关矩阵。关于使用大型稀疏矩阵的协方差矩阵找到 PCA 的包的任何想法?最好在 python 中,尽管 matlab 和 R 也可以。

(作为引用,有人问了一个类似的问题 here 但这些方法指的是协方差矩阵)。

最佳答案

它们不是一回事吗?据我了解,相关矩阵只是由每个变量的标准差的乘积归一化的协方差矩阵。而且,如果我没记错的话,PCA 中是否存在缩放歧义?

关于python - 使用相关矩阵在大型稀疏矩阵上进行 PCA,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13592841/

相关文章:

python - parse_dates 如何与 pd.read_sql_query 一起使用

python - Serializers.validated_data 字段已更改为 DRF 中的源值

matlab - 如何使用 Matlab SVM 分类器中 crossval() 函数的输出创建混淆矩阵?

python - 使用 if 解析列中的数据

python - 如何在 numpy 中有效地组合排列?

python - 如何在测试时将 Django/DRF 中的日期时间转换为字符串

python - Python 中的子字符串搜索

matlab - 如何在 MATLAB 中使用 FastICA 将数据投影到独立组件上

java - matlab 调用 Findclass JNI 崩溃

python - 点积的矩阵推广