我有稀疏 CSR 矩阵(来自两个稀疏向量的乘积),我想将每个矩阵转换为平面向量。事实上,我想避免使用任何密集表示或迭代索引。
到目前为止,唯一的解决方案是使用 coo 表示来迭代非 null 元素:
import numpy
from scipy import sparse as sp
matrices = [sp.csr_matrix([[1,2],[3,4]])]*3
vectorSize = matrices[0].shape[0]*matrices[0].shape[1]
flatMatrixData = []
flatMatrixRows = []
flatMatrixCols = []
for i in range(len(matrices)):
matrix = matrices[i].tocoo()
flatMatrixData += matrix.data.tolist()
flatMatrixRows += [i]*matrix.nnz
flatMatrixCols += [r+c*2 for r,c in zip(matrix.row, matrix.col)]
flatMatrix = sp.coo_matrix((flatMatrixData,(flatMatrixRows, flatMatrixCols)), shape=(len(matrices), vectorSize), dtype=numpy.float64).tocsr()
确实令人不满意且不优雅。有谁知道如何以有效的方式实现这一目标?
最佳答案
你的平面矩阵是(3,4);每行是 [1 3 2 4]。如果子矩阵为 x
,则该行为 x.A.T.flatten()
。
F = sp.vstack([x.T.tolil().reshape((1,vectorSize)) for x in matrices])
F
是相同的(dtype 是 int)。我必须将每个子矩阵转换为 lil
,因为 csr
尚未实现 reshape
(在我的 sparse
版本中)。我不知道其他格式是否有效。
理想情况下,sparse
可以让您执行整个范围的 numpy
数组(或矩阵)操作,但目前还没有。
鉴于此示例中的尺寸较小,我不会推测替代方案的速度。
关于Numpy/Scipy - 稀疏矩阵到向量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24440332/