我有一个稀疏矩阵(我从 python 函数接收),我想将其转换为 numpy 矩阵。 numpy 矩阵不适合本地 RAM,我想将其放入 pySpark 中的 RDD 中。我一般对 Spark 不太熟悉,所以我不知道如何将本地空间矩阵加载到 RDD 中。
最佳答案
此问题是通过“1.4.1 Spark 知识之前”提交的。显然spark库中已经添加了稀疏矩阵。 Spark SparseMatrix
关于python - pyspark:将稀疏局部矩阵转换为 RDD,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30877484/